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今天 ,互联 网 已 经 彻底 改变 了 经 济 系统 的 运行 方式 ,经 济 增长 的 决定 性 要 素 已 经 从 物质 
资料 的 增加 转变 成 为 信息 的 增长 。 但 是 ,只 有 信息 的 快速 增长 是 不 够 的 ,这 些 增 长 的 信息 还 
必须 是 “有 序 ” 的 。 只 有 “有 序 ” 才 能 使 信息 具有 价值 ,能 够 为 人 所 用 ,能 够 指导 我 们 实现 商业 
的 新 路 径 。 这 种 包含 在 信息 里 的 隐形 秩序 才 是 今天 信息 世界 的 真正 价值 所 在 。 经 济 系统 的 
运行 确实 是 纷繁 复杂 的 ,但 因为 算法 的 存在 ,这 一 切 变 得 有 律 可 循 ,算法 也 成 为 新 经 济 系统 里 
那 只 “看 不 见 的 手 ”"”。 那 么 算法 究竟 是 如 何 保障 信息 的 有 序 增长 的 ? 又 是 如 何 改变 和 控制 我 
们 的 经 济 系统 的 ? 在 这 本 书 中 ,我 们 将 赛 博 经 济 系 统 从 上 至 下 进行 了 梳理 ,把 推荐 算法 、 分 配 
算法 .匹配 算 法 ,动态 定价 算法 、 大 数据 处 理 算法 、 数 据 交 易 算法 、 隐 私 保护 算法 和 区 块 链 技术 
及 相关 算法 在 新 经 济 组 织 中 的 运行 做 了 深入 浅 出 的 阐述 ,从 而 为 读者 打开 了 新 经 济 的 现在 与 
未 来 的 大 门 。 本 书 虽 有 专业 的 深度 ,但 也 适合 一 般 读 者 阅读 ,同时 这 些 创新 背后 的 算法 逻辑 
也 将 帮助 企业 更 好 地 规划 自己 的 商业 模式 和 未 来 战略 。 


本 书 封面 贴 有 清华 大 学 出 版 社 防 伪 标 签 ,无 标签 者 不 得 销售 。 
版 权 所 有 ,侵权 必 究 。 侵 权 举 报 电话 : 010-62782989 13701121933 


图 书 在 版 编目 (CIP) 数 据 


算法 统治 世界 : 智能 经 济 的 隐形 秩序 / 徐 恪 , 李 沁 著 .一 北京 : 清华 大 学 出 版 社 ,2017 
(2017. 12 重印 ) 
ISBN 978-7-302-48808-8 


I Q@ 算 … I[[ @@ 徐 … @ 李 … 轩 , 计算 机 算法 一 应 用 一 经 济 系 统一 研究 NN. DF014.9 
中 国 版 本 图 书馆 CIP 数据 核 字 (2017) 第 265983 号 


责任 编辑 : 龙 启 铭 
封面 设计 : 传 瑞 学 
责任 校对 : 李 建 庄 
责任 印 制 : 宋 林 


出 版 发 行 : 清华 大 学 出 版 社 
网 址 : http://www. tup. com. cn, http://www. wqbook. com 
地 址 : 北京 清华 大 学 学 研 大 厦 A 座 邮 编 : 100084 
社 总 机 : 010-62770175 邮  ” 购 : 010-62786544 
投稿 与 读者 服务 : 010-62776969 ，c-service@tup. tsinghua. edu. cn 
质量 反馈 : 010-62772015，zhiliang@tup. tsinghua. edu. cn 
课件 下 载 : http://www. tup. com. cn,010-62795954 


印 装 者 : 北京 亿 浓 世纪 彩色 印刷 有 限 公司 

经 销 : 全 国 新 华 书店 

开 本 : 170mmX230mm ”印张 : 23.5 插页 : 1 字 数 : 442 干 字 

版 次 : 2017 年 12 月 第 1 版 印 次 : 2017 年 12 月 第 2 次 印刷 
印 数 : 3001 一 5000 

定 价 : 69. 00 元 


产品 编号 : 076220-02 


如 今 ,互联 网 如 同 高 速 公 路 一 样 ,成 为 了 人 类 社会 的 
信息 基础 设施 ,在 经 济 领域 健生 出 众多 前 所 未 有 的 商业 新 
形态 ,并 开始 影响 和 改变 整体 社会 经 济 系统 的 运行 方式 。 
当 网 络 与 经 济 系 统 不 断 融 合 ,催生 出 了 一 种 全 新 的 经 济 系 
统 ,我 们 将 之 称 为 “ 赛 博 经 济 系统 ” (Cyber Economic 
System) , 它 是 以 广泛 连接 和 海量 数据 为 基础 ,以 互联 网 技 
术 为 载体 ,以 算法 为 内 在 驱动 力 的 新 型 经 济 系统 。 

新 经 济 系 统 已 经 到 来 ,但 我 们 还 没 来 得 及 真正 深入 探 
寻 其 内 在 规律 ,特别 是 2008 年 的 经 济 危机 ,很 少 有 经 济 学 
家 做 出 提前 预测 的 现实 ,让 经 济 学 领域 一 时 陷入 低谷 , 纳 
西 姆 . 塔 勒 布 在 《4 黑 天 势 ) 一 书 中 将 原因 归结 为 “ 因 变化 而 
需要 知识 的 事物 ,通常 是 没有 专家 的 "。 的 确 ,经 济 学 面 对 
的 问题 太 复 杂 ,复杂 到 几乎 不 可 预测 。 虽 然 经 济 领域 正 变 
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得 越 来 越 复 杂 , 但 天 气 系统 其 实 同样 复杂 ,而 借助 超级 计算 机 ,我 们 至 少 可 以 
预报 近期 的 天 气 。 类 似 的 例子 还 有 AlphoGo, 当 AlphoGo 战胜 李 世 石 时 ,人 
类 棋 手 第 一 人 柯 洁 痛苦 地 承认 :“ 人 类 几 和 干 年 甚至 没 人 沾 到 围棋 真理 的 边 ”， 
而 AlphoGo 为 围棋 真理 打开 了 新 的 大 门 。 这 些 例 子 在 启发 我 们 思考 ,是 不 
是 我 们 也 没有 沾 到 经 济 系统 运行 真理 的 边 ? 也 许 我 们 需要 一 些 新 的 思路 。 

麻 省 理工 学 院 的 物理 学 家 塞 萨 尔 . 伊 达尔 戈 在 《增长 的 本 质 》 一 书 中 给 
出 了 一 个 有 趣 的 想法 :“ 经 济 是 通过 实体 化 信息 ,增强 人 类 对 于 知识 的 实际 
应 用 的 系统 ”,“ 经 济 增长 的 本 质 ,是 因为 信息 ( 量 ) 的 增长 "。 如 果 我 们 采用 
“增长 "的 概念 来 重新 定义 赛 博 新 经 济 ,那么 赛 博 新 经 济 是 信息 增长 更 快 的 经 
济 。 赛 博世 界 为 信息 的 增长 提供 了 快速 路 径 ,这 是 由 赛 博 的 特征 决定 的 。 赛 
博 的 特征 包括 小 世界 、 信 息 级 联 、 窜 律 和 长 尾 等 ,这 些 都 是 赛 博 世界 所 独 有 
的 ,这 也 让 赛 博时 代 的 信息 增长 速度 超过 以 往 任何 时 候 。 

不 过 ,只 有 信息 的 快速 增长 ,还 是 不 够 的 。 这 些 增 长 的 信息 还 必须 是 有 
序 " 的 。 只 有 "有 序 " 才 能 使 信息 具有 价值 ,能 够 为 人 所 用 ,这 是 一 种 隐形 的 秩 
序 。 这 种 包含 在 信息 里 的 隐形 秩序 , 才 是 今天 信息 世界 的 真正 价值 所 在 。 那 
么 我 们 该 如 何 保证 信息 按照 有 序 的 方式 增长 ? 经 济 系 统 的 运行 确实 是 纷繁 
复杂 的 ,但 因为 算法 的 存在 ,使 一 切 变 得 有 律 可 循 ,从 某 种 意义 上 说 ,算法 已 
经 成 为 新 经 济 系统 里 那 只 “看 不 见 的 手 ”。 

那么 算法 究竟 是 什么 ? 又 有 哪些 算法 正在 改变 和 控制 着 我 们 的 经 济 系 
统 ? 在 这 本 书 中 ,我 们 将 赛 博 经 济 系统 从 上 至 下 进行 了 梳理 ,把 推荐 算法 、 分 
配 算法 .匹配 算法 \ 动 态 定价 算法 `. 区 块 链 技术 及 相关 算法 ,大 数据 处 理 算法 、 
数据 交易 算法 和 隐私 保护 算法 如 何 推动 新 经 济 系 统 的 运行 做 了 详细 阐述 。 
当然 ,仅仅 理解 和 掌握 这 些 算 法 ,并 不 能 保证 对 经 济 系统 运行 做 出 准确 预测 ， 
但 当 我 们 理解 了 这 些 算法 和 它们 所 代表 的 赛 博 经 济 的 隐形 秩序 后 ,或 许 再 次 
面 对 经 济 系统 的 不 确定 性 时 ,会 增加 一 份 信心 ,相信 也 会 帮助 大 家 从 中 找到 
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解决 问题 的 全 新 视角 。 

这 里 要 多 说 一 句 , 身 为 计算 机 科学 工作 者 ,从 事 经 济 学 方面 的 研究 似乎 
有 不 务 正业 之 嫌 , 但 最 近 经 济 学 知名 期 刊 Econometrica 的 主编 、 经 济 学 家 
Joel Sobel 在 一 次 会 议 报 告 中 指出 ,当前 经 济 学 中 最 有 趣 的 研究 是 计算 机 科 
学 家 完成 的 ,因为 计算 机 科学 家 有 场景 有 平台 并 能 真正 通过 实验 验证 理论 。 
这 给 了 我 这 样 的 研究 者 莫大 的 鼓励 ,我 个 人 认为 ,未 来 经 济 学 的 重大 突破 很 
可 能 会 来 自 计算 机 科学 工作 者 和 经 济 学 工作 者 的 合作 研究 ,让 我 们 共同 努 
力 ,使 这 一 天 早日 到 来 。 

本 书 的 研究 得 到 了 国家 自然 科学 基金 (61472212) 支 持 , 在 此 深 表 谢意 。 
在 本 书 的 编写 过 程 中 ,我 们 借鉴 吸收 了 许多 国内 外 专家 学 者 的 研究 成 果 , 在 
此 也 致 以 诚挚 的 谢意 。 本 书 部 分 内 容 曾 经 在 “网 络 科 学 与 策略 机 制 * 互 联网 
发 展 导论 "和 “互联 网 发 展 与 创新 经 济 " 课 程 中 进行 过 讲授 ,同学 们 也 提出 了 
非常 宝贵 的 意见 ,在 此 一 并 致谢 。 教 学 的 快乐 也 许 就 在 于 此 吧 。 感 谢 我 的 研 
究 生 苏 辉 、 李 立 , 李 彤 、 吴 波 . 吕 亮 , 付 瑶 , 张 欣欣 , 张 宇 超 、 杨 帆 、 姚 文兵 ,感谢 
我 的 合作 者 李 泌 女士。 还 要 感谢 清华 大 学 社 科学 院 的 王 勇 教授 ,他 的 洞 见 和 
观察 使 我 获 益 恨 多 。 
于 水 平 , 书 中 不 可 避免 存在 欠缺 之 处 ,县 请 读者 批评 指正 。 读 者 可 以 
通过 关注 “ 赛 博 新 经 济 " 公 众 号 和 我 们 交流 。 


徐 恪 
207 年 10 月 


算法 定义 的 新 经 济 系统 


5G 通信 技术 已 经 悄然 出 现 ,这 个 号 称 * 人 类 历史 上 最 


复杂 的 通信 系统 ” ,预计 将 在 2020 和 


E 开 始 商 月 


日 化 ;2016 稀 


FE3 


月 15 日 , 当 韩 国 棋 手 李 世 石 在 第 180 手 投 子 认输 的 那 一 
刹那 ,宣告 了 以 AlphaGo 为 代表 的 人 工 智能 技术 开启 了 办 
新 的 一 页 ;2016 年 8 月 ,中 国 将 世界 上 第 一 颗 量 子 通信 卫 


星 “* 墨 子 号 " 送 入 太空 轨道 ,并 完成 了 人 类 历史 上 首次 量子 


通信 过 程 ; 中 国 在 关键 技术 上 的 重大 突破 ,有 望 使 量子 计 
“人 类 正在 加 速 进入 赛 


算 机 在 四 五 年 内 进入 实用 阶段 … 
博时 代 。 


如 果 把 时 间 倒 推 三 十 多 年 9 , 那 时 的 人 们 应 该 很 难 想 
象 : 用 来 打 电 话 的 手机 能 够 完成 这 么 多 事情 ; 素 不 相识 人 


EE 


@@ 1986 年 ,美国 NSFNET 建成 ,有 人 认为 这 是 互联 网 真正 诞生 的 标志 性 事件 。 
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之 间 可 以 跨越 时 间 和 地 域 的 限制 相识 相知 ;任何 一 个 角落 里 发 生 的 事情 都 可 
以 在 几 分 钟 之 内 传 遍 世 界 ; 普 通 和 人 也 能 一 呼 百 应 ,影响 干 干 万 万 的 人 。 赛 博 
时 代 ,高 度 发 达 的 互联 网 络 在 人 与 人 之 间 、 人 与 物 之 间 , 架 起 一 道道 看 不 见 的 
连接 线 , 将 素 不 相识 的 人 貌似 毫 无 关联 的 物 ,连接 在 了 一 起 ,缩短 了 时 空 的 
距离 。 

同时 ,这 种 无 所 不 连 的 连接 也 打破 了 原 有 经 济 系 统 中 的 生产 、 消 费 \ 市 场 
等 环节 ,形成 了 覆盖 更 广 .连接 度 更 高 ,效率 更 快 的 新 经 济 系统 , 即 赛 博 新 经 
济 。 赛 博 新 经 济 自 出 生 之 日 起 就 展现 出 极 强 的 生命 力 , 发 展 速度 远 超过 去 任 
何 一 个 经 济 时 代 , 这 其 中 还 涌现 出 许多 充满 活力 的 新 机 制 、 新 模式 。 随 着 算 
法 不 断 地 渗透 ,信息 增长 的 秩序 和 赛 博 新 经 济 系统 的 运行 秩序 也 不 断 地 被 它 
重新 定义 和 改写 ,从 某 种 程度 上 ,我 们 甚至 可 以 说 , 它 决定 了 经 济 系统 的 不 断 
进化 。 


信息 与 秩序 


人 们 曾经 以 采集 食物 为 生 , 而 如 今 他 们 要 重新 以 采集 信息 为 生 ,尽管 这 
件 事 看 起 来 很 不 可 思议 。 
一 一 马 歌 尔 。 麦 克 卢 汉 ,原创 媒介 理论 家 、 思 想 家 
小 米 董事 长 雷军 曾 说 :“ 投 身 信息 产业 的 怀抱 快 三 十 年 了 ,我 有 时 也 在 
想 : 信息 何以 会 具备 如 此 强大 的 力量 ? 它 的 力量 来 自 哪里 ? 我 们 又 该 如 何 
轰 驭 这 一 力量 ?作为 见证 中 国 互联 网 崛起 的 企业 家 ,雷军 依然 对 信息 这 个 词 
有 所 困惑 ,更 不 要 说 普通 人 。 
20 世纪 40 年 代 末 ,信息 的 概念 开始 出 现 ,并 以 迅雷 不 及 掩 耳 之 势 扩展 


焉 
了 中 


到 很 多 学 术 领 域 。 信 息 既 不 是 宏观 的 ,也 不 是 微观 的 , 它 可 以 刻 在 古巴 比 伦 
人 用 于 记录 的 泥 板 上 ,也 可 以 隐藏 在 一 段 生 物 DNA 中 。 它 几乎 适用 于 所 有 
学 科 领 域 ,这 种 超然 的 性 质 使 得 它 在 人 类 的 知识 体系 中 具有 非常 重要 的 
地 位 。 

1948 年 7 月 ,时 年 32 岁 的 克 劳 德 . 艾 尔 伍德 * 香农 (Claude Elwood 
Shannon) 在 The Bell System Technical Journal 上 发 表 了 论文 A Mathematical 
Theory of Communication( 通 信 的 数学 理论 )。 这 篇 划时代 论文 的 发 表 , 标 
志 着 现代 信息 论 研究 的 开端 ,截至 2017 年 6 月 ,这 篇 文章 的 Google Scholar 
引用 量 已 经 超过 六 万 。 在 这 篇 论文 里 ,香农 带 给 人 们 一 个 自 创 的 新 词 “ 比 
特 "。 香 农 对 这 个 新 词 的 解释 是 “测量 信息 的 单位 ”, 到 现在 ,比特 已 经 和 干 
克 , 分 摄氏度 等 一 样 ,成 为 人 们 日 常生 活 中 常见 的 量 纲 。 在 香农 提出 的 信息 
理论 中 ,信息 粹 是 一 个 重要 的 概念 ,可 以 用 来 定量 反映 信息 的 不 确定 程度 。 
例如 ,在 自然 语言 处 理 中 ,中 文 的 静态 平均 信息 炉 是 9. 65 比特 ,而 英文 是 4. 
03 比特 ,中 文 的 信息 类 于 英文 ,说 明 中 文 的 复杂 程度 更 高 ,词义 更 丰富 ,但 
处 理 起 来 也 更 困难 。 

在 信息 理论 提出 后 ,为 了 让 人 们 更 好 地 理解 这 一 理论 ,香农 指出 需要 把 
信息 和 含义 区 分 开 ,不 能 混淆 在 一 起 。 这 样 的 考虑 是 出 于 工程 和 哲学 两 个 方 
面 的 原因 。 从 工程 技术 的 角度 来 讲 , 香 农 当 时 致力 于 制造 一 种 能 够 使 信息 得 
到 传递 的 机 器 ,该 机 器 无 须 了 解 所 传递 信息 的 真实 意义 。 从 哲学 的 角度 来 
讲 ,“ 含 义 " 与 “信息 "这 两 个 词 ,其 实 是 完全 不 同 的 概念 。 

首先 ,信息 本 身 是 无 意义 的 。 麻 省 理工 学 院 的 知名 物理 学 家 塞 萨 尔 ' 伊 
达尔 戈 在 其 所 著 的 《增长 的 本 质 》 一 书 中 肯定 了 ”信息 是 无 意义 的 "这 个 概念 。 
伊 达尔 戈 认为 ,对 人 类 来 说 ,要 将 信息 和 含义 区 分 开 是 很 困难 的 ,因为 人 们 会 
不 自觉 地 将 自己 理解 的 含义 注入 信息 ,并 认为 这 是 理所当然 的 。 例 如 对 于 
“1111" 这 一 串 数 字 ,喜欢 网 络 购物 的 人 想到 的 是 “ 双 十 一 "购物 节 ; 单 身 狗 们 
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想到 的 可 能 是 光棍 节 ; 而 对 于 学 计算 机 的 人 ,可 能 想到 的 是 二 级 制 的 数字 
15。 从 这 个 例子 可 以 看 到 ,对 于 信息 “1111" 来 说 ,不 论 是 购物 节 还 是 光棍 节 ， 
都 是 人 们 在 无 意 中 强 加 上 去 的 含义 ,这 些 意义 并 不 是 该 信息 本 身 的 一 部 分 ， 
但 入 们 无 法 控制 这 种 解读 信息 的 本 能 。 有 时 候 ,信息 和 含义 可 能 会 完美 地 结 
合 在 一 起 ,但 这 也 并 不 意味 着 信息 本 身 是 有 意义 的 。 

其 实 ,信息 是 没有 实体 的 ,但 信息 又 是 物质 性 的 , 它 能 够 被 物理 性 的 表达 
呈现 出 来 。 信 息 可 以 理解 为 一 种 物理 秩序 ,或 是 物理 事物 的 组 合 方式 。 对 于 
汉字 来 说 ,每 一 个 汉字 都 可 以 看 作 笔画 的 组 合 ,或 者 是 笔画 的 排列 秩序 ,人 们 
对 其 中 一 些 组 合 赋予 或 强加 了 意义 , 才 形 成 了 文字 ;英文 单词 也 是 一 样 ,是 英 
文字 母 的 排列 秩序 。 显 然 , 这 样 的 笔画 或 字母 的 秩序 远 远 大 于 汉字 或 英文 单 
词 的 数量 ,那些 没有 被 赋予 含义 的 组 合 仍然 是 不 具备 意义 的 信息 。 从 这 个 角 
度 出 发 ,上 面 所 讲 的 信息 “1111” 的 例子 就 很 好 理解 了 : 1111 的 不 同 含义 其 实 
是 代表 了 信息 “1111” 的 某 一 种 特定 秩序 。 

在 赛 博 新 经 济 时 代 , 信 息 的 重要 作用 日 益 凸 显 , 并 在 社会 经 济 增长 方面 
进发 出 巨大 的 能 量 。《 增 长 的 本 质 ) 一 书 指出 :“ 经 济 是 通过 实体 化 信息 , 增 
强人 类 对 于 知识 的 实际 应 用 的 系统 “经 济 增长 的 本 质 ,是 因为 信息 ( 量 ) 的 增 
长 "。 这 里 ,信息 增长 促进 赛 博 经 济 增长 ,包含 了 两 层 含义 : 首先 ,信息 能 够 
在 赛 博世 界 中 快速 增长 。 赛 博时 代 具 有 有 别 于 以 往 任何 时 代 ( 如 农业 时 代 、 
蒸汽 机 时 代 ) 的 特征 ,这 些 特征 包括 小 世界 \ 信 息 级 联 、 咯 律 和 长 尾 等 ,这 是 赛 
博时 代 所 独 有 的 由 赛 博 带 来 的 特征 DO。 在 这 些 特征 的 作用 下 , 赛 博 时 代 中 信 
息 的 增长 速度 超过 以 往 任何 时 候 。 赛 博世 界 为 信息 增长 提供 了 快速 路 径 , 并 
且 这 样 的 路 径 只 存在 于 赛 博世 界 中 。 其 次 ,促进 经 济 增长 的 信息 是 “有 序 ” 


Q@ 更 多 关于 赛 博 特征 的 内 容 ,可 参见 ( 赛 博 新 经 济 :“ 互 联网 十 ”的 新 经 济 时 代 》( 清 华 大 
学 出 版 社 ) 。 
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的 , 即 这 些 信息 中 包含 了 某 种 隐形 的 秩序 。 赛 博时 代 中 如 果 只 有 信息 的 快 
速 增长 是 不 够 的 ,正如 前 面 所 讲 , 增 长 的 信息 可 能 是 无 序 的 ,没有 任何 意 
义 。 物 质 的 排列 秩序 是 多 种 多 样 的 ,这些 排列 秩序 里 ,有 些 是 有 意义 的 ,有 
些 则 可 能 什么 都 不 是 。 例 如 一 团 杂 乱 无 章 的 纤维 是 纤维 这 种 物质 的 一 种 
排列 秩序 ,而 在 另 一 种 排列 秩序 下 ,这 团 纤 维 可 以 编织 为 秋子。 显然 ,纤维 
的 两 种 排列 秩序 都 是 信息 ,相对 于 杂乱 无 章 的 秩序 ,第 二 种 排列 比 第 一 种 
更 为 “有 序 ”, 这 种 “有 序 " 使 信息 具有 了 某 种 含义 和 价值 ,能 够 为 人 所 用 ,这 
就 是 一 种 隐形 的 秩序 。 我 们 可 以 把 这 种 信息 称 为 知识"。 可 见 ,这 种 包含 
在 信息 里 的 隐形 的 秩序 才 是 信息 的 价值 所 在 , 才 是 这 个 世界 所 需要 的 , 才 
能 促进 社会 经 济 增长 。 

在 赛 博 世界 中 ,每 时 每 刻 都 有 大 量 新 的 信息 产生 ,也 有 老 旧 信息 消亡 。 
对 于 人 类 社会 经 济 系统 来 说 ,那些 包含 有 秩序 的 信息 (也 就 是 知识 ) 才 是 需 
的 , 正 是 不 断 增 长 的 知识 才 促 进 了 社会 .经济 不 断 向 前 发 展 。 赛 博 ( 互 联网 ) 
的 存在 ,只 是 信息 能 够 快速 增长 的 基础 ,这 些 混 乱 的 信息 需要 一 种 力量 去 有 
序 化 ,这 股 力量 就 是 在 赛 博 世界 里 不 断 渗透 和 不 断 演进 的 算法 。 从 赛 博 的 本 
质 ,到 赛 博 系统 中 的 各 种 上 层 应 用 ,其 背后 都 有 算法 的 存在 。 算 法 保证 了 信 
息 的 有 序 增长 。 

此 外 ,算法 还 在 建立 另外 一 种 秩序 一 一 赛 博 新 经 济 的 运行 规律 。 从 经 济 
系统 底层 信息 .数据 的 产生 增长 ,到 上 层 的 具体 应 用 实践 ,算法 都 在 其 中 起 
着 决定 性 的 作用 。 信 息 的 有 序 增 长 促进 经 济 增长 ,算法 决定 着 信息 增长 的 秩 
序 , 同 样 也 决定 了 赛 博 新 经 济 系统 的 秩序 。 
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新 经 济 还 需要 男 一 只 “看 不 见 的 手 ” 


他 这 样 做 只 是 被 一 只 看 不 见 的 手 引 导 着 ,去 促进 一 个 并 不 是 出 自 他 本 心 
的 目的 。 

一 一 亚当 。 斯 密 

随 着 互联 网 和 移动 互联 网 的 发 展 ,建立 在 其 上 的 应 用 和 服务 ,无 论 称 为 
“互联 网 十 "还 是 “十 互联 网 ” ,我 们 都 能 看 到 它 对 于 人 类 社会 的 巨大 改变 。 三 
上 年 前 人 们 很 难 想象 ,三 十 年 后 人 们 只 需要 简单 地 点 击 几 下 手机 , 足 不 出 户 
就 可 以 处 理 大 多 数 日 常事 务 。 今 天 ,一 个 普通 人 的 一 天 很 可 能 如 此 度 过 : 

早晨 , 当 你 一 觉醒 来 ,会 使 用 手机 控制 灯光 亮 起 、 享 受 智 能 厨具 做 好 的 美 
味 早 餐 , 浏 览 今日 头条 推送 的 新 闻 事 件 和 好 友 的 微 信和 留言 。 出 门 上 班 ,通过 
在 线 查看 实时 交通 状况 并 规划 出 行路 径 和 方式 ,可 以 选择 搭乘 网 约 专车 ,或 
是 公共 交通 。 在 公司 ,按照 日 程 安排 处 理 公务 .收发 邮件 、 参 加 视频 会 议 。 到 
了 中 午 , 可 以 一 边 享 受 网 上 预订 的 外 卖 ,一 边 追 一 追 感 兴趣 的 美剧 ,或 是 听 听 
在 线 音 乐 。 午 体 时间, 可 以 打 理 下 网 络 理财 产品 ,或 是 逛 逛 电 商 的 网 站 。 下 
班 后 ,可 以 尽情 吃喝 玩乐 ,在 朋友 圈 秀 自拍 。 

我 们 对 上 面 描述 的 这 一 切 已 经 习以为常 ,并 将 这 一 切 理所当然 归功 于 互 
联网 。 然 而 ,“ 互 联网 ”是 一 个 浅 层次 的 答案 ,不 够 准确 ,也 不 够 本 质 。 两 百 多 
FE 前 ,英国 经 济 学 家 亚当 斯 密 (Adam Smith) 在 《国富 论 ) 中 用 “看 不 见 的 
"来 描述 市 场 机 制 在 经 济 运行 中 的 作用 。 与 此 相似 ,我 们 发 现在 赛 博世 界 ， 
在 经 济 运 行 以 及 这 些 日 常 活动 的 背后 ,也 存在 着 另 一 只 看 不 见 的 手 , 在 有 条 
不 亲 地 操纵 着 一 切 ,维持 着 系统 的 正常 运转 。 


内 
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而 这 只 看 不 见 的 手 ,就 是 “算法 "。 日 常 行为 的 背后 所 涉及 的 一 些 算法 如 
表 0.1 所 示 。 


表 0.1 日 常 活动 背后 的 算法 


活动 /应 用 涉及 的 算法 
手机 控制 智能 家 居 无 线 通信 与 加 解密 
浏览 推送 新 闻 推荐 
视频 会 议 包 调度 、 音 视频 编 解 码 
网 络 约 车 匹配 ,路径 规划 \ 动 态 定价 
网 络 购物 推荐 `. 区 块 链 
在 线 音乐 .影视 平台 推荐 . 音 视 频 编 解码 
拍照 美化 图 像 处 理 
网 络 金融 分 配 \ 区 块 链 、 匹 配 
交通 状况 查询 大 数据 处 理 


可 以 说 ,几乎 所 有 的 经 济 运行 流程 ,或 是 人 们 的 活动 ,都 是 由 算法 在 幕后 
重新 建立 一 种 秩序 。 就 拿 在 电 商 网 站 购物 来 说 , 当 你 选择 了 购买 某 种 商品 ， 
算法 会 判断 这 种 商品 剩余 数量 是 否 能 满足 你 的 购买 量 ,如 果 可 以 满足 , 则 会 
将 你 选 购 的 商品 放 入 购物 车 ;如 果 剩 余数 量 不 足 的 话 , 会 返回 一 个 提示 信息 。 
在 结算 时 ,算法 会 根据 商品 单价 和 购买 数量 ,计算 你 需要 支付 的 金额 ,在 这 个 
过 程 中 ,算法 也 会 自动 查询 你 是 不 是 有 可 用 的 优惠 券 或 满足 打折 条 件 。 如 果 
你 选择 在 线 支付 ,算法 会 显示 相应 的 支付 界面 。 付 款 后 ,算法 会 计算 出 送 货 
时 间 , 并 显示 在 你 的 手机 或 计算 机 屏幕 上 。 一 个 简化 的 网 络 购物 流程 如 
图 0.1 所 示 。 

通过 上 述 购 物流 程 ,可 以 体会 到 算法 在 人 们 日 常 活动 中 所 起 的 作用 , 必 
须 按照 算法 规定 的 流程 来 操作 ,否则 就 不 会 成 功 。 其 实 不 只 是 人 们 的 日 常事 
务 , 就 连 赛 博 新 经 济 的 基础 一 一 互联 网 ,保证 其 正常 运行 的 核心 因素 也 是 算 
法 。 如 果 您 是 计算 机 网 络 领域 的 从 业者 ,也 许 对 此 并 不 陌生 。 这 类 算法 有 个 
专门 的 名 字 , 称 为 “网 络 协议”。 网 络 协议 就 是 为 了 便于 计算 机 网 络 中 的 不 同 
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浏览 网 页 
1 选择 购物 平台 
选择 要 购买 的 商品 
1 协商 交易 事宜 
加 入 购物 车 | 


| 继续 购物 


结账 


了 
确认 是 否 注册 用 户 


填写 收 货 人 信息 


确认 或 修改 收 货 人 信息 


| 后台 确 定 交 易 内 容 
选择 支付 方式 


货 到 付款 


| 支付 成 功 相关 支付 平台 


图 01 简化 的 网 络 购物 流程 图 


计算 机 之 间 进 行 通信 和 数据 交换 而 建立 的 所 有 计算 机 都 要 共同 遵守 的 标准 
或 约定 。 众 所 周知 ,互联 网 又 称 为 网 际 网 ,是 由 各 种 不 同 的 网 络 构成 的 ,网 络 


协议 则 是 这 些 网 络 之 间 能 够 连通 的 保证 。 举 个 简单 的 例子 ,一 位 中 


国企 业 家 


与 一 位 德国 老板 开会 商谈 合作 事宜 ,如 果 中 国企 业 家 只 懂 中 文 , 德 国 老板 只 
懂 德 文 , 那 他 们 没有 办 法 正常 交流 ;如 果 两 人 的 秘书 都 懂 英 文 ,那么 一 方 的 秘 
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书 可 以 先 将 自己 上 司 要 表达 的 意思 转化 为 英文 传递 给 对 方 秘书 , 对 方 秘书 接 
收 到 对 方 信息 后 ,再 将 英文 转化 为 自己 老板 的 母语 ,这 样 ,交流 就 可 以 愉快 地 
进行 下 去 。 在 这 个 过 程 中 ,秘书 和 英语 就 起 到 了 类 似 网 络 协议 的 作用 。 

一 个 标准 的 网 络 协议 至 少 包括 语法 .语义 和 时 序 三 个 要 素 : 

。 语法 ; 规定 了 用 户 数据 和 控制 信息 的 格式 ,包括 数据 出 现 的 顺序 ; 

。 语义 : 规定 了 各 种 控制 信息 的 意义 ,说 明 通信 双方 应 该 怎么 做 ; 

。 时 序 : 规定 了 事件 的 顺序 ,例如 何 时 通信 、 先 做 什么 、 后 做 什么 、 传 输 

速度 等 。 

用 上 面 中 国企 业 家 和 德国 老板 开会 的 例子 来 类 比 的 话 ,语法 就 是 大 家 都 
能 理解 的 英语 语法 ,例如 定语 从 向 、 状 语 从 和 句 等 等 ;语义 就 是 使 用 的 英语 单词 
和 语句 的 意义 ;时 序 就 是 两 位 秘书 事先 商量 好 : 谁 先 说 、 谁 后 说 , 先 讨 论 什 么 
内 容 、 后 讨论 什么 内 容 , 语 速 是 快 还 是 慢 等 等 。 

网 络 协议 有 很 多 ,其 中 最 著名 的 莫 过 于 TCP/IP 协议 。TCPVIP 是 
Transmission Control Protocol/Internet Protocol 的 简写 ,中 文 名 称 是 传输 控 
制 协议 /互联 网 协议 。 事 实 上 ,TCP/IP 协议 是 一 个 协议 族 ,包括 很 多 协议 ， 
例如 UDP 协议 ICMP 协议 等 等 ,TCP 协议 和 IP 协议 是 其 中 最 广为人知 的 
两 个 协议 。 顾 名 思 义 ,TCP 协议 是 为 数据 传输 提供 服务 的 协议 , 它 通 过 一 种 
称 为 “三 次 握手 "的 机 制 在 终端 之 间 建 立 连接 ,提供 可 靠 的 传输 服务 。“ 三 次 
握手 "机 制 得 名 的 原因 ,是 传输 数据 的 终端 之 间 要 通过 三 次 交互 过 程 才 能 完 
成 可 靠 连 接 的 建立 。 有 一 个 名 为 “我 给 你 讲 一 个 TCP 的 笑话 吧 ” 的 段子 生动 
地 描绘 这 一 过 程 。 

路 人 甲 ; 好 想 听 一 个 笑话 。 

路 人 乙 : 你 好 ,你 想 听 TCP 的 笑话 吗 ? 

路 人 甲 : 嗯 ,我 想 听 一 个 TCP 的 笑话 。 

路 人 乙 : 好 的 ,我 会 给 你 讲 一 个 TCP 的 笑话 。 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


路 人 甲 : 好 的 ,我 会 听 一 个 TCP 的 笑话 。 

路 人 乙 : 你 准备 好 听 一 个 TCP 的 笑话 吗 ? 

路 人 甲 : 嗯 ,我 准备 好 听 一 个 TCP 的 笑话 。 

路 人 乙 : Ok, 那 我 要 发 TCP 笑话 了 。 大 概 有 10 秒 ,20 个 字 。 

路 人 甲 : 嗯 ,我 准备 收 你 那个 10 秒 钟 长 ,20 个 字 的 笑话 了 。 

路 人 乙 : 抱 菊 ,你 的 连接 超时 了 。 你 好 ,你 想 听 TCP 的 笑话 吗 ? 

好 吧 ,这 个 笑话 有 点 冷 ,我 们 需要 知道 的 是 网 络 中 所 有 的 “行为 ", 例 如 建 
立 连 接 \ 发 送 / 接 收 数据 等 等 ,都 是 由 标准 化 组 织 制定 的 各 种 网 络 协 议 来 规范 
的 。 这 些 网 络 协议 不 能 直接 搬 到 网 络 上 用 ,还 需要 由 码 农 们 用 机 器 语言 把 这 
些 协议 “翻译 "成 各 种 网 络 终 端 能 够 “看 懂 ” 的 形式 ,也 就 是 大 家 俗称 的 “ 程 
序 "。 在 这 些 程序 里 ,包含 了 各 种 各 样 不 同 功能 的 算法 , 正 是 这 些 算 法 保证 了 
网 络 协议 中 所 描述 的 功能 能 够 实现 ,例如 路 由 协议 的 实现 依赖 于 最 短路 径 算 
法 ,传输 控制 协议 的 实现 依赖 于 排队 算法 等 等 。 一 般 来 说 ,网 络 协议 的 实现 
需要 多 个 算法 共同 支持 。 有 时 候 , 网 络 协议 本 身 就 是 一 个 算法 ,例如 三 次 握 
手 协 议 。 很 多 时 候 , 网 络 协议 之 间 还 存在 复杂 的 依赖 关系 ,这 里 就 不 多 讲 了 。 

是 的 ,我 们 使 用 的 每 一 个 计算 机 软件 程序 、APP, 背 后 都 是 算法 。 也 许 
我 们 常 在 新 闻 报道 里 见 到 “程序 “应 用 “软件 “算法 "等 意义 相近 的 词汇 ,这 
在 媒体 报道 里 很 少 加 以 区 分 。 

不 过 ,为 了 保证 其 严谨 和 准确 性 ,我 们 在 本 书 会 使 用 算法 ,而 不 是 “程序 ” 
或 是 “软件 ”。 算 法 ,程序 软件 ,是 三 个 既 有 区 别 又 有 联系 的 词汇 。 算 法 是 针 
对 某 一 问题 的 解决 方案 的 准确 描述 。 例 如 计算 机 领域 的 排序 算法 描述 的 是 ， 
给 定 一 列 数 ,按照 由 大 到 小 或 由 小 到 大 的 顺序 输出 : 如 果 输 入 是 (5,3,9,2， 
6) , 则 输出 是 (2,3,5,6,9) 或 (9,6,5,3,2)。 算 法 可 以 使 用 自然 语言 来 描述 ， 
当然 也 可 以 使 用 计算 机 语言 或 是 数学 语言 。 算 法 一 定 要 在 有 限 的 步骤 中 得 
到 问题 的 结果 , 即 满足 有 穷 性 。 而 程序 就 不 一 样 了 ,程序 不 一 定 满足 有 穷 性 ， 


亚 
ul 


它 可 以 进入 无 限 循环 的 状态 ,例如 计算 机 操作 系统 ,只 要 不 关机 或 者 系统 不 
遭 到 破坏 , 它 就 会 一 直 运转 ,等 待 新 的 任务 到 达 。 此 外 ,程序 是 使 用 编程 语言 
好 成 的 ,用 于 实现 某 种 特定 目的 的 一 组 计算 机 指令 。 如 果 将 一 个 算法 使 用 编 
程 语言 进行 描述 ,就 成 为 一 个 程序 ,该 程序 是 这 个 算法 在 计算 机 上 的 特定 实 
现 。 软 件 , 则 是 程序 的 有 机 集合 体 ,软件 中 可 以 只 有 一 个 程序 ,也 可 以 是 多 个 
程序 的 集合 ,程序 从 属于 软件 。 例 如 手机 上 或 计算 机 里 最 简单 的 计算 器 ,就 
只 包含 数值 计算 程序 ;而 Office 办 公 软 件 则 包含 了 Word、PowerPoint、Excel 
等 多 个 程序 。 对 比 算法 ,程序 软件 这 三 个 词 ,可 以 看 出 算法 的 含义 是 最 明确 
的 ,程序 或 软件 只 是 算法 的 某 种 特定 实现 或 这 些 实现 的 集合 ,而 且 程 序 或 软 
件 包含 的 范围 更 大 ,不 如 算法 准确 。 算 法 描述 更 准确 .更 本 质 。 


被 算法 唤醒 的 新 经 济 


生产 率 不 等 于 一 切 , 但 长 期 看 它 几 乎 意味 着 一 切 。 
一 一 保罗 。 克 重 格 曼 , 经 济 学 家 , 诺 贝尔 经 济 学 奖 获 得 者 

从 经 济 系统 的 角度 看 , 赛 博 经 济 系统 继承 了 传统 经 济 系统 的 各 个 组 成 部 
分 ,并 赋予 了 它们 新 的 特点 ,形成 了 赛 博 下 的 生产 系统 、 交 换 系 统 、 消 费 系 统 
和 金融 系统 ,如 图 0. 2 所 示 。 

从 上 至 下 贯穿 赛 博 经 济 系统 的 算法 包括 八 类 ,分 别 是 推荐 算法 、 分 配 算 
法 匹配 算法 ,动态 定价 算法 、 区 块 链 技 术 及 相关 算法 、 大 数据 处 理 算法 、 数 据 
交易 算法 隐私 保护 算法 。 同 时 ,每 一 类 都 包括 针对 不 同 具体 问 题 的 算法 ,以 
及 数量 不 非 的 侧重 不 同方 面 的 变种 。 
由 于 经 济 系统 不 是 孤立 运行 的 , 它 必 然 会 造成 同一 类 算法 可 能 既 存 于 这 
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算法 六 下 : 安全 隐 
Er 六 遇 克 友 这 
六 分 本 < 女 区 块 甸 
数据 了 
基础 层 A 
DATA 


图 02 算法 定义 经 济 总 体 结构 图 


个 子 系统 ,又 跟 那 个 子 系统 有 联系 。 我 们 尝试 把 这 八 类 算法 按 支 撑 关 系 对 应 
到 四 个 经 济 子 系统 中 ,会 看 到 在 金融 系统 和 消费 系统 中 包含 的 算法 多 于 另外 
两 个 系统 。 这 是 因为 ,金融 系统 和 消费 系统 从 来 就 是 经 济 体系 中 最 活跃 最 
有 生命 力 和 创造 力 的 两 个 系统 ,与 实际 生活 联系 最 紧密 ,相应 地 ,衍生 的 经 济 
活动 和 关系 最 复杂 ,需要 更 多 的 算法 提供 支撑 。 不 过 这 并 不 意味 着 支撑 生产 
系统 和 交换 系统 的 算法 就 少 ,要 知道 种 类 相对 少 并 不 代表 数量 就 一 定 少 。 
以 消费 系统 为 例 , 动 态 定 价 算法 大 量 应 用 于 日 常 的 网 络 约 车 、 团 购 等 应 
j。 人 们 在 淘宝 .京东 \` 亚 马 逊 等 众多 电 商 的 购物 数据 ,特别 是 “ 双 十 一 "等 节 
日 消费 ,构成 了 人 们 的 消费 大 数据 , 电 商 要 从 这 些 繁 杂 的 数据 中 推断 用 户 的 
个 人 喜好 、 群 体 趋势 ,必然 要 用 到 大 数据 处 理 算法 。 在 赛 博时 代 , 人 们 的 很 多 
行为 都 搬 到 了 互联 网 络 上 ,例如 征婚 交友 、\ 股 票 买卖 ,这 些 都 是 匹配 算法 的 用 
武之 地 。 推 荐 算法 就 更 不 用 说 ,是 广告 商 和 电 商 最 关注 的 算法 之 一 ,因为 推 
荐 精准 度 往往 决定 了 销售 量 的 高 低 。 无 论 是 以 前 ,还 是 现在 ,安全 和 隐私 问 
题 一 直 受 到 人 们 很 大 的 关注 ,在 赛 博时 代 更 是 上 升 到 一 个 前 所 未 有 的 高 度 ， 
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束 
了 中 


交易 安全 .隐私 保护 等 算法 可 谓 任重道远 。 

赛 博 经 济 时 代 , 受 到 赛 博 世界 独 有 的 不同 于 以 往 任何 时 代 的 “小 世界 ”、 
宕 律 和 长 尾 .无 所 不 能 的 计算 等 特点 的 影响 ,生产 活动 变 成 以 消费 者 的 需求 
为 导向 ,满足 消费 者 的 不 同 个 性 化 需求 为 目的 ,从 而 展现 出 新 的 经 济 形态 特 
征 , 比 如 数据 经 济 ,共享 经 济 .平台 经 济 和 虚拟 经 济 。 显 然 , 这 四 个 方面 的 特 
征 跟 赛 博 经济 系 统 的 特点 密 不 可 分 ,仍然 离 不 开 算法 的 支撑 。 

从 数据 基础 来 看 ,在 赛 博时 代 下 ,每 天 产生 的 数据 用 海量 已 不 足以 形容 。 
据 报道 ,搜索 引擎 谷歌 (Google) 现 在 每 天 要 处 理 来 自 全 球 的 超过 55 亿 次 的 
搜索 请 求 ; 早 在 2012 年 1 月 ,视频 网 站 YouTube 每 天 为 观众 播放 影片 的 次 
数 就 达到 惊人 的 40 亿 次 ,服务 器 每 分 钟 要 应 付 长 约 60 小 时 的 影片 上 传 量 ， 
也 就 是 说 在 1 秒 钟 的 时 间 里 要 处 理 长 度 为 1 小 时 的 影片 。 网 络 公 司 思科 
(Cisco) 预 测 ,全 球 互联 网 总 流量 将 在 2016 年 超过 1ZB, 而 这 个 数值 在 2019 
年 还 要 再 翻 一 番 。 

ZB 是 容量 单位 ,全 称 是 Zetta Byte, 它 的 大 小 关系 是 1ZB== 1024EB= 
1024X1024PB=1024X1024X1024TB==1024X1024X1024X1024GB, 这 个 
数据 量 有 多 大 呢 ? 按 全 球 人 口 70 亿 计算 ,人 均 产 生 约 157GB, 也 就 是 约 160 
843MB 的 数据 ,这 相当 于 每 人 拍 了 32 168 张 数 码 照片 (每 张 照片 按 5MB 计 
算 ) ,或 是 拍摄 7 小 时 长 的 4k/30fps 高 清 视频 ( 按 1 分 钟 4k/30fps 视频 约 
375MB 计算 ) 。 

互联 网 时 代 以 前 ,数据 量 还 不 大 ,用 人 工 的 方法 大 致 上 还 能 应 付 过 来 。 
但 今天 我 们 必须 面 对 这 些 多 到 无 法 想象 的 数据 ,其 中 还 包括 很 多 无 秩序 的 数 
据 , 靠 人 工 显 然 是 无 法 处 理 的 ,要 想 发 现 或 挖掘 出 数据 中 蕴含 的 价值 ,只 能 求 
助 于 大 数据 处 理 算法 。 也 就 是 说 ,没有 算法 ,数据 累积 得 再 多 也 只 是 一 堆 数 
据 而 已 ,没有 什么 用 处 ;只 有 算法 出 现 了 ,数据 中 隐藏 的 有 用 信息 (秩序 ) 才 能 
被 发 现 ,数据 也 才能 变 成 “ 金 矿 ”。 
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在 前 面 的 介绍 中 我 们 已 经 了 解 到 ,从 信息 的 角度 出 发 , 赛 博 经 济 是 信息 
增长 更 快 的 经 济 。 到 这 里 ,我 们 已 经 明白 ,信息 有 序 增长 与 快速 增长 的 核心 
原因 是 算法 。 因 此 ,从 算法 的 角度 来 定义 赛 博 新 经 济 可 能 更 为 准确 。 

算法 贯穿 了 赛 博 经 济 系统 的 方方面面 ,支撑 整个 系统 运转 ,核心 地 位 不 
言 而 喻 。 如 果 说 ,互联 网 的 出 现 与 发 展 ,形成 的 是 赛 博 经 济 系统 的 “身体 ”, 那 
么 ,算法 形成 的 则 是 赛 博 经 济 系统 的 “灵魂 ", 这 两 者 相辅相成 , 缺 一 不 可 , 构 
成 了 一 个 有 机 整体 。 在 此 基础 上 ,我 们 可 以 在 赛 博 新 经 济 概念 的 基础 上 再 前 
进一步 ,提出 算法 定义 经 济 (Algorithm Defined Economic System, ADES) 的 
概念 , 即 : 

算法 定义 经 济 是 指 以 算法 为 核心 的 .以 信息 (包括 知识 和 数据 ) 为 资源 、 
以 网 络 为 基础 平台 的 一 种 经 济 形态 ,在 其 中 ,算法 决定 了 信息 增长 的 秩序 , 同 
时 它 贯 穿 了 经 济 系统 的 所 有 组 成 部 分 和 流程 ,支撑 并 控制 系统 中 各 种 经 济 活 
动 以 及 所 形成 的 各 种 经 济 关 系 , 决 定 了 经 济 系统 的 秩序 。 

我 们 从 算法 定义 经 济 的 概念 里 ,也 可 以 看 出 这 种 经 济 类 型 的 一 些 特 
性 : 首先 , 它 是 一 种 知识 型 科技 型 经 济 。 算 法 本 身 是 一 种 完成 某 种 特定 
功能 的 ,高 度 凝 练 的 知识 ,属于 科学 技术 的 范畴 ,自然 而 然 地 就 给 经 济 系统 
也 打上 了 科技 的 烙印 。 其 次 , 它 是 一 种 高 渗透 型 的 经 济 。 从 底层 的 基础 平 
台 ,数据 的 产生 和 处 理 , 到 经 济 系统 的 组 成 .运行 的 全 过 程 ,算法 的 身影 无 
处 不 在 ,这 是 一 种 灵魂 与 躯体 的 关系 ,高 渗透 是 一 种 天 生 的 属性 。 同 时 , 它 
是 一 种 “ 软 ” 性 经 济 。 历 史上 曾经 出 现 过 的 农业 经 济 、 工 业经 济 等 经 济 形 
态 , 农 业 、 工 业 都 是 具体 的 、 实 在 的 概念 ,是 “ 硬 " 属 性 。 而 算法 从 本 质 上 讲 
是 一 种 知识 ,属性 偏 * 软 ” ,不 过 ,这 种 “ 软 " 经 济 却 具有 相当 的 硬 实力 。 在 这 
种 “ 软 " 性 经 济 形态 下 ,经 济 系 统 的 各 组 成 部 分 都 得 到 极 大 的 强化 和 优化 ， 
经 济 活力 和 增长 速度 都 超过 以 往 任何 一 种 经 济 形态 ,充分 诠释 了 “科技 是 
第 一 生产 力 ” 这 人 旬 名 言 。 
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由 于 算法 自身 所 具有 的 独特 属性 ,使 得 算法 定义 经 济 具 有 高 度 自动 化 、 
高 可 扩展 、 高 鲁 棒 性 等 特征 。 第 一 , 它 是 一 种 高 度 自动 化 的 经 济 形态 。 从 网 
络 基础 ,到 上 层 各 类 应 用 过 程 ,都 由 算法 掌控 ,减少 了 人 为 因素 的 干扰 ,系统 
运行 效率 高 。 第 二 , 它 是 一 种 高 可 扩展 的 经 济 形态 ,经 济 活 动 和 行为 由 算法 
定义 和 控制 ,意味 着 经 济 活动 的 增加 和 消亡 ,从 算法 的 角度 来 讲 非常 易于 实 
现 。 第 三 , 它 是 一 种 高 鲁 棒 性 的 自 适应 的 经 济 形态 ,算法 是 随 信息 技术 的 前 
进而 动态 发 展 的 ,在 这 个 过 程 中 可 以 不 断 自身 修复 和 迭代 ,提升 效率 和 增强 
健壮 性 ,从 而 带动 整个 系统 健康 发 展 。 在 当前 ,算法 定义 经 济 的 一 个 典型 例 
子 就 是 赛 博 新 经 济 。 


正在 崛起 的 算法 帝国 


进化 可 能 会 在 不 同系 统 中 创造 出 用 来 解决 相同 问题 的 不 同 算法 。 

讲 算法 ,就 必然 要 说 到 人 工 智 能 ,也 要 讲 到 大 数据 ,很 难 把 这 三 者 割裂 
开 。 在 实际 中 ,很 多 人 经 常 将 算法 与 人 工 智能 混 诡 在 一 起 。 我 们 认为 ,算法 
是 基础 ,人 工 智能 是 表现 ,人 工 智 能 是 建立 在 算法 高 度 发 达 的 基础 之 上 。 同 
样 ,大 数据 之 所 以 成 为 “ 金 矿 ” ,也 是 因为 有 能 够 处 理 、 挖 掘 大 数据 的 算法 
出 现 。 

算法 的 发 展 历史 远 远 长 于 互联 网 的 历史 , 早 在 古巴 比 伦 、 古 埃及 时 代 就 
已 经 有 了 算法 的 记载 。 从 最 初 的 萌芽 到 现在 ,算法 从 来 没有 停止 它 的 步伐 ， 
一 直 在 进化 发 展 。 在 早期 ,算法 可 能 更 多 地 聚焦 在 数学 问题 的 计算 及 其 相关 
应 用 上 。 从 20 世纪 三 四 十 年 代 开始 ,得 益 于 现代 计算 机 和 互联 网 的 发 展 , 算 


19 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


法 的 发 展 有 了 长 足 的 进步 ,加 快 了 向 其 他 领域 渗透 的 步伐 ;算法 的 规模 也 不 
再 局 限于 在 单 台 终 端 ,大 型 分 布 式 算法 纷纷 出 现 。 特 别 是 20 世纪 末 , 互 联网 
浪潮 泗 涌 而 来 ,再 加 上 后 来 移动 互联 网 的 爆发 式 发 展 ,互联 网 已 经 成 功 “ 入 
侵 " 人 类 社会 经 济 生活 的 方方面面 。 可 以 说 ,如 果 没 有 互联 网 这 个 新 丁 ( 相 对 
于 算法 来 说 ) 的 出 现 ,算法 也 无 法 达到 现在 “一 统 天 下 "的 高 度 。 总 的 来 说 , 互 
联网 从 两 个 方面 加 速 了 算法 成 就 其 统治 地 位 。 首 先 ,互联 网 填补 了 百 古 以 来 
就 存在 的 不 同 地 域 间 巨大 的 时 间 和 空间 沟 密 ,将 世界 万 物 连 在 一 起 ,世界 被 
推 平 了 。 世 界 变 平 以 后 ,时 空 距离 大 大 减 小 ,人 类 经 济 社会 联系 更 加 紧密 ,时 
效 性 大 大 提高 ,这 使 得 经 济 系统 的 运行 不 断 加 速 。 在 这 样 的 情况 下 ,原来 的 
经 济 系统 不 断 被 算法 改造 ,算法 深度 嵌入 经 济 系统 的 运行 。 第 二 ,互联 网 使 
得 产生 信息 (数据 ) 与 收集 信息 (数据 ) 的 效率 同时 提升 ,不 仅 信息 (数据 ) 产 生 
地 更 快 、 更 多 ,信息 (数据 ) 的 收集 也 变 得 越 来 越 快 。 这 种 情况 的 出 现 , 从 另 一 
个 方面 促进 算法 的 进步 ,能 够 处 理 海量 数据 的 算法 不 断 出 现 ,也 使 得 人 们 越 
来 越 依赖 大 数据 处 理 的 结果 。 十 时 的 “ 兵 马 未 动 ,粮草 先行 ”, 在 赛 博时 代 变 
成 了 “ 兵 马 未 动 , 数 据 先 行 ”。 

最 近 , 现 实生 活 中 也 出 现 了 越 来 越 多 的 算法 成 为 主导 的 例子 。 据 说 ， 
2016 年 美国 总 统 大 选 , 特 朗 普 如 愿 登 上 总 统 宝 座 ,就 是 借助 了 算法 分 析 的 结 
果 。2016 年 9 月 , 特 朗 普 的 竞争 团队 给 英国 的 一 家 数据 分 析 公 司 Cambridge 
Analytica 支付 了 500 万 美元 (也 有 人 说 是 100 万 美元 ) 的 咨询 费用 。 这 家 公 
司 使 用 先进 的 大 数据 处 理 算 法 帮助 特 朗 普 分 析 美 国 选民 的 行为 。 根 据 分 析 
公司 的 分 析 结 果 , 特 朗 普 的 团队 能 够 精准 把 握 选民 的 心理 ,投放 竞选 广告 时 
也 能 做 到 有 的 放 矢 ,在 不 知 不 觉 中 占 得 先 机 ,这 500 万 美元 花 得 很 值 。 而 反 
观 希 拉 里 的 团队 ,还 是 采用 传统 的 民意 调查 数据 ,同时 也 过 度 依赖 所 谓 专家 
的 意见 ,最 终 只 能 黯然 咽 下 失败 的 苦果 。 对 比特 朗 普 和 希拉 里 的 竞选 ,可 以 
看 到 特 朗 普 依 靠 大 数据 和 算法 ,有 两 个 优点 : 一 是 分 析 公 司 获取 的 大 数据 来 


20 


亚 
ul 


源 更 丰富 、 更 客观 、 也 更 贴近 真实 ,而 民 调 数据 数据 量 小 且 比 较 片面 ;二 是 
法 分 析 更 客观 ,不 带 入 任何 主观 性 ,而 专家 分 析 则 往往 带 有 专家 本 人 的 倾向 ， 
引入 了 主观 和 干扰。 在 这 次 大 选中 ,比尔 盖世 巴菲特 扎 克 伯 格 和 马云 等 领 
袖 人 物 押 错 了 宝 ,可 谓 追 悔 莫 及 。 

在 赛 博 经 济 时 代 ,算法 已 经 逐渐 “上 位 "的 事实 也 可 以 从 * 全 球 最 大 市 值 
的 上 市 公司 "的 排名 变化 中 窥见 一 二 。 据 有 关 报 道 , 在 2001 年 ,全 球 最 大 市 
值 上 市 公司 的 Top5 分 别 是 通用 电气 微软、 埃 克 森 美 孚 (石油 )、 花 旗 银 行 、 
沃尔玛 (零售 )。 到 了 2006 年 ,这 个 排名 变 为 埃 克 森 美孚 (石油 )、 通 用 电气 、 
道 达尔 (石油 ) 、 微 软 \ 花 旗 银 行 ,前 五 名 中 ,科技 公司 的 代表 仍然 是 微软 。 再 
过 5 年 ,到 了 2011 年 ,Top5 的 排名 变化 为 埃 克 森 美孚 (石油 ) 苹果、 中 石油 、 
壳牌 (石油 )、 中 国 银行 。 这 个 时 期 ,科技 公司 的 代表 仍然 只 有 一 家 ,只 是 从 微 
软 变 成 了 苹果 。 不过, 可喜 的 是 ,中 国企 业 中 石油 和 中 国 银行 上 榜 ! 时 间 来 
到 2016 年 ,Top5 排名 发 生 了 翻天 覆 地 的 变化 ,排名 前 5 的 是 苹果 ,谷歌 、 微 
软 ,亚马逊 .Facebook。 可 以 看 到 ,这 5 家 公司 都 是 清一色 的 互联 网 科技 公 
司 ,算法 是 这 类 公司 竞争 力 的 集中 体现 。 而 传统 的 钢铁 石油、 银行 .地 产 等 
行业 的 跨国 企业 则 悄然 走 下 了 神 坛 。 

在 新 经 济 时 代 , 得 益 于 算法 的 发 展 和 支撑 作用 ,应 用 层面 的 各 种 新 玩法 
和 新 模式 层出不穷 ,经 济 系统 展现 出 勃勃 生机 。 不 仅 如 此 ,底层 基础 网 络 平 
台 也 不 甘 寂 寞 。 随 着 算法 的 发 展 , 人 们 对 未 来 网 络 的 架构 又 提出 了 很 多 新 的 
设想 ,SDN(Software Defined Network ,软件 定义 网 络 ) 就 是 其 中 有 代表 性 的 
一 种 。SDN 的 设想 是 将 网 络 的 控制 层面 和 数据 层面 分 开 , 由 用 户 根 据 实际 
需要 ,通过 软件 (实际 上 是 算法 ) 来 控制 和 管理 底层 的 网 络 设备 ,完成 数据 流 
的 路 由 、 转 发 等 功能 。 这 一 设计 赋予 了 互联 网 极 大 的 灵活 性 和 敏捷 性 ,能 够 
契合 赛 博时 代 下 瞬息 万 变 的 业务 环境 需求 。SDN 一 经 提出 就 得 到 了 各 国电 
信 运 营 商 和 互联 网 设备 生产 商 的 高 度 关注 和 支持 。 可 以 看 到 ,SDN 其 实 也 
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是 互联 网 算法 发 展 到 相当 高 度 的 产物 ,如 果 SDN 完全 实现 ,将 进一步 巩固 算 
法 在 系统 中 的 核心 地 位 。 

算法 不 会 停止 它 前 进 的 脚步 。 在 算法 的 驱动 下 ,将 来 必然 会 出 现 更 高 
级 、 更 有 活力 的 经 济 形态 ,不 断 将 社会 经 济 推 向 更 高 的 水 平 。 在 不 远 的 将 来 ， 
我 们 会 越 来 越 深 刻 地 感受 到 ,算法 崛起 ,势不可挡 。 
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第 1 章 算法 到 研 是 什么 


人 类 其 实 一 直 就 生活 在 算法 的 世界 里 。 关 于 算法 的 智慧 早 就 充斥 在 中 
国 的 万 里 长 城 古 巴比伦 的 空中 花园 、 阿 尔 式 弥 斯 神 庙 和 埃及 金字 塔 里 , 充 斥 
在 “ 曹 冲 称 象 “ 田 忌 赛马 ”等 典故 里 ,也 充斥 在 今天 时 刻 运转 着 的 互联 网 、 奔 
跑 的 汽车 以 及 天 空中 的 各 种 飞行 器 里 。 大 约 是 从 十 几 年 前 起 ,人 们 开始 频繁 
提 到 “算法 ”这 个 词 , 然 而 , 那 时 大 多 数 人 可 能 还 不 了 解 算 法 的 准确 含义 ,或 者 
认为 ,这 是 属于 搞 数 学 或 者 计算 机 科学 的 专家 才 应 该 明白 的 事情 。 到 了 今 
天 ,算法 已 经 成 了 人 们 耳熟能详 的 一 个 词语 ,社会 生活 的 各 个 角落 和 我 们 生 
命 的 每 分 每 秒 都 与 算法 紧密 相连 。 算 法 不 仅 存在 于 人 们 的 手机 和 笔记 本 电 
脑 中 ,还 存在 于 居住 的 房屋 、 使 用 的 电器 .乘坐 的 汽车 火车 ,以 及 小 朋友 爱 不 
释 手 的 各 种 电子 玩具 中 。 现 代 的 算法 能 够 安排 人 们 每 天 的 日 程 ,能 够 处 理 复 
杂 的 金融 交易 ,还 能 管理 和 经 营 企 业 , 为 人 们 提供 各 种 娱乐 和 生活 便利 。 我 
们 已 经 不 敢 想象 ,如 果 突 然 有 一 天 ,所 有 的 算法 都 停止 运转 ,人 类 的 文明 秩序 


会 不 会 立刻 朋 塌 ? 
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如 何 定义 算法 


今天 大 部 分 的 软件 都 很 像 上 百 万 块 砖 堆 司 在 一 起 组 成 的 埃及 金字 塔 , 缺 
乏 结 构 完 整 性 ,只 能 靠 强力 和 成 千 上 万 的 奴隶 完成 。 
一 一 艾 伦 ， 饥 ,图 灵 奖 获得 者 


古 时 的 计算 方法 


雄伟 的 非洲 大 陆 上 ,世界 第 一 长 河 一 一 尼罗河 自 南 向 北 流 贯 非洲 东北 
部 , 它 起 源 于 大 湖 地 区 的 卡 盖 拉 河 , 最 后 注入 地 中 海 。 尼 罗 河 有 定期 泛滥 的 
特点 ,每 年 8 月 到 达 最 高 水 位 ,洪水 来 时 会 淹没 两 岸 的 农田 ,洪水 退去 留 下 厚 
厚 的 淤泥 ,形成 肥沃 的 土壤 。 日 积 月 累 ,形成 了 现在 的 尼罗河 三 角 洲 ,这 里 物 
产 丰富 、 人 口 密 集 , 孕 育 了 古 埃 及 文明 。 

在 尼罗河 下 游 岸 边 ,散布 着 几 十 座 大 大 小 小 的 金字 塔 。 金字塔 是 古 埃及 
劳动 人 民 高 超 建筑 技艺 的 杰作 ,大 约 在 公元 前 3000 年 左右 开始 出 现 ,是 世界 
八大 建筑 奇迹 之 一 。 著 名 的 胡 夫 金字 塔 ,建成 时 高 146. 5 米 ,底座 每 边 长 230 
多 米 , 三 角 面 斜 度 52", 塔 底面 积 52 900 平方 米 ; 它 的 塔 身 由 230 万 块 石 头 块 
砌 成 ,这 些 石 块 平均 重 2.5 吨 , 最 大 的 重 达 160 吨 。 有 学 者 估计 ,如 果 把 这 些 
石 块 间 碎 , 铺 成 一 条 一 尺 宽 的 道路 ,大 约 可 以 绕 地 球 一 周 。 更 令 人 惊叹 的 是 ， 
金字 塔 塔 身 的 石 块 之 间 , 没 有 任何 水 泥 之 类 的 粘着 物 ,而 是 像 搭 积木 一 样 由 
这 些 大 小 不 一 的 石 块 垒 起 来 的 ;这 些 石 块 各 个 面 都 磨 得 很 平 ,虽然 至 今 已 过 
去 数 干 年 ,但 人 们 也 很 难 把 薄 薄 的 刀刃 插入 石 块 之 间 的 颖 隙 。 
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哈 瓦 斯 (Zahi Hawass) 是 埃及 著名 的 考古 学 家 和 金字塔 专 家 ,多 年 来 一 
直 致 力 于 金字 塔 . 古 埃及 遗迹 及 其 历史 研究 。 他 的 研究 表明 , 古 埃及 人 在 建 
造 金字 塔 前 ,很 可 能 绘制 了 详细 的 平面 设计 图 ,这 其 中 就 涉及 大 量 复 杂 的 计 
算 和 测量 。 在 那个 时 代 , 古 埃及 人 已 经 开始 使 用 绳子 来 丈量 土地 。 有 一 个 专 
门 的 工种 称 为 职业 结 强人 ,他 们 的 工作 就 是 在 测量 用 的 绳子 上 ,根据 规定 的 
长 度 打出 等 间隔 的 绳 结 ,负责 修建 的 工人 使 用 这 种 打 结 的 绳子 进行 丈量 。 有 
说 法 称 ,很 可 能 是 这 些 职 业 结 强人 最 先 发 现 某 些 长 度 固定 的 三 条 绳子 能 够 构 
成 直角 三 角形 ,这 些 绳子 包括 由 3 个 .4 个 .5 个 等 间隔 的 绳 结 长 度 组 成 的 ,也 
包括 由 5 个 、12 个 .13 个 等 间隔 的 强 结 长 度 组 成 ,这 正好 是 勾 股 定理 描述 的 
直角 三 角形 三 边 长 。 

而 中 国 最 早 记载 勾 股 定理 的 古籍 是 4 周 佣 算 经 》 据 记载 ,大 约 是 周 武王 
灭 商 (公元 前 1046 年 ) 的 时 候 , 一 个 叫 商 高 的 人 发 明了 勾 股 测量 术 , 也 就 是 我 
们 平时 所 说 的 “ 勾 三 、 股 四 、 弦 五 ”, 比 古 埃 及 人 略 晚 一 些 。 古 埃及 人 还 需要 解 
决 的 另 一 个 难题 是 如 何 准 确 画 出 直角 ,因为 金字 塔 的 地 基 必 须 是 正方 形 , 它 
的 四 个 角 必 须 是 严格 的 直角 ,如 果 稍 有 偏差 ,就 会 导致 整个 建筑 走 形 ,甚至 垮 
掉 。 史 学 家 研究 表明 , 古 埃 及 人 可 能 是 这 样 做 的 : 先 在 地 上 打 进 两 个 木 桩 ， 
后 


后 绷 紧 木 柱 间 的 绳子 ,这 样 就 画 出 一 条 直线 ,成 为 金字 塔 的 一 条 边线 。 然 
后 ,在 两 个 木 桩 上 各 系 上 一 条 绳子 ,绳子 的 长 度 要 超过 两 个 木 桩 距离 的 一 半 。 
拉 紧 绳子 的 末端 ,以 木 桩 为 原点 转动 , 画 出 两 条 相交 的 圆 弧 来 。 过 这 两 条 贺 
弧 的 交点 , 画 出 男 一 条 直线 ,与 先 确定 的 那 条 直线 相交 , 夹 角 就 是 准确 的 直 
角 。 这 里 的 后 一 条 直线 ,就 是 地 基 的 另 一 条 边线 ,如 图 1. 1 所 示 。 

从 古 埃及 人 建造 金字 塔 的 过 程 中 ,我 们 能 隐隐 约 约 看 到 计算 方法 的 萌 
芽 。 正 是 这 些 实践 应 用 中 的 需求 ,使 得 数学 和 计算 方法 日 益 受到 重视 并 开始 
发 展 起 来 。 
除了 古 埃及 , 男 一 个 古文 明 一 一 古巴 比 伦 ,也 留 下 了 丰富 的 关于 计算 的 
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图 11 上 古 埃及 人 画 直 角 示 意图 


数学 遗迹 。 大 约 公元 前 18 世纪 ,古巴 比 伦 王国 出 现在 美 索 不 达 米 亚 平 原 地 
区 ,大 致 位 置 是 在 现在 的 伊拉克 共和 国境 内 。 古 巴比伦 当时 使 用 一 种 巴掌 大 
小 的 泥 板 来 记录 各 种 信息 ,这 些 信息 使 用 一 种 有 棱 有 角 的 攀 形 文字 , 压 印 在 
这 些 泥 板 上 。 这 种 文字 是 由 约 公元 前 3200 年 的 苏 美 尔 人 所 发 明 ,是 世界 上 
最 早 的 文字 之 一 。 

通过 近 两 百年 对 美 索 不 达 米 亚 的 考古 发 掘 ,以 及 语言 学 家 对 大 量 泥 板 文 
献 成 功 地 译 读 , 人 们 终于 知道 攀 形 文字 是 已 知 的 世界 最 古老 的 文字 。 它 是 由 
古代 苏 美 尔 人 发 明 , 阿 卡 德 人 加 以 继承 和 改造 的 一 种 独特 的 文字 体系 。 巴 比 
伦 和 亚 述 人 也 先后 继承 了 这 份 宝贵 的 文化 遗产 ,并 把 它 传播 到 西亚 其 他 地 
方 。 从 17 世纪 开始 ,探险 家 和 考古 学 者 就 曾 从 两 河流 域 一 带 破碎 的 陶器 ,以 
及 石雕 和 泥 板 的 残片 上 发 现 了 这 些 奇异 的 文字 符号 。 到 了 19 世纪 ,考古 学 
家 先后 发 掘 出 数 千 块 印 有 枢 形 文字 的 古巴 比 伦 时 期 的 泥 板 。 经 过 几 代 人 的 
不 懈 努 力 , 大 部 分 泥 板 上 的 枢 形 文字 被 解密 。 让 人 大 吃 一 惊 的 是 ,有 数 百 块 
泥 板 上 都 是 记录 的 关于 计算 和 数学 方面 的 内 容 , 包 括 乘法 表 、 倒 数 表 .平方 和 
立方 表 等 ,如 图 1. 2 所 示 。 

古巴 比 伦 文明 当时 使 用 的 是 六 十 进 制 ,不 是 现在 常用 的 十 进 制 。 在 很 多 
泥 板 上 ,都 能 发 现 算法 的 踪影 。 例 如 ,在 图 1. 3 所 示 的 泥 板 上 就 记录 着 这 样 
的 问题 ; 一 块 长 方形 土地 的 面积 加 上 长 与 宽 之 差 是 33( 六 十 进 制 , 按 十 进 制 
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图 13 记录 数学 问题 的 古巴 比 伦 泥 板 
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就 是 183) ,而 长 与 宽 之 和 为 27, 问 这 块 地 的 长 、. 宽 以 及 面积 是 多 少 ? 古巴 比 
伦 人 的 解法 书写 在 这 块 泥 板 的 第 6 一 29 行 ,他 们 也 算出 了 正确 的 结果 ,这 块 
地 的 长 为 15, 宽 为 12。 

再 来 看 看 我 国 古代 数学 计算 方法 的 发 展 情况 。 我 国 关 于 算法 的 研究 最 
早 可 以 追溯 到 公元 前 1 世纪 ,在 《 周 佣 算 经 》 里 就 描述 了 很 多 数学 计算 和 天 文 
学 方面 的 内 容 。 在 我 国 古代 ,一 般 涉及 数学 计算 方面 的 著作 ,作者 大 都 会 冠 
以 “ 算 经 ”二 字 。 在 唐 代 , 国 子 监 设立 的 算 学 馆 就 将 当时 已 有 的 十 部 著名 的 数 
学 著作 作为 教材 ,统称 为 “ 算 经 十 书 ”, 这 十 部 书 是 :《 周 钥 算 经 《 九 章 算术 》 
《孙子 算 经 兴 五 曹 算 经 兴 夏 侯 阳 算 经 兴 张 丘 建 算 经 兴 海 岛 算 经 兴 五 经 算术 》 
《 缀 术 》 和 《 缉 古 算 经 )》。 在 这 些 早期 的 数学 著作 中 ,记载 了 大 量 的 计算 方法 ， 
比如 前 面 提 到 的 勾 股 定理 ,还 阐述 了 分 数 问题 “ 礁 不 足 ” 问 题 ,甚至 包括 负数 
等 ,如 图 1.4 所 示 。 


图 14 中 国 古 代数 学 计算 著作 


有 趣 的 是 ,古人 不 仅仅 把 计算 方法 用 在 数学 问题 上 ,还 应 用 在 其 他 领域 。 
中 国 唐 代 有 一 个 “ 杨 损 考 吏 ”的 故事 。 这 个 故事 是 说 唐 代 有 一 位 清正 廉明 的 
尚书 官 杨 损 , 有 一 次 需要 从 两 名 下 属 中 选拔 一 人 到 当时 的 财务 部 任职 。 经 过 
考评 ,两 名 候选 人 都 很 优秀 , 难 分 高 低 。 主 管 这 项 工作 的 官员 难以 抉择 ,于 是 
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向 杨 损 请 示 。 杨 损 听 完 考 评介 绍 , 想 了 一 会 儿 , 说 道 :“ 这 个 部 门 的 办 事 人 
员 , 需 要 具备 比较 扎实 的 计算 能 力 , 这 样 吧 , 咱 们 出 一 道 计 算 题 , 谁 先 做 出 正 
确 答案 ,就 选 谁 于是, 杨 损 给 出 了 一 道 计算 题 :“ 有 人 无 意 中 听 到 几 个 盗贼 
在 分 赃 , 偷 的 是 金 砖 。 如 果 每 个 人 分 6 块 , 就 多 出 5 块 ;如 果 每 个 人 分 7 块 ， 
就 会 差 8 块 , 问 有 几 个 盗贼 在 分 多 少 块 金 砖 ?最 后 两 名 候选 人 中 先 算 出 正确 
答案 的 得 到 了 提拔 , 杨 损 也 因 办 事 公道 .任人唯贤 而 名 声 流传 。 


近代 的 算法 


布 伦 瑞 克 (Brunswick) 是 德国 中 北部 一 个 的 城市 。 据 考 , 布 伦 瑞 克 最 早 
并 不 是 城市 ,而 是 几 个 互 不 相关 的 居民 点 ,后 来 这 些 居 民 点 各 自发 展 ,最 后 连 
接 到 一 起 , 才 形 成 了 后 来 的 城市 。 另 外 一 个 说 法 则 是 说 布 伦 瑞 克 是 由 来 自 萨 
克 森 王朝 的 两 兄弟 布鲁诺 和 丹 克 瓦尔 德 黄 基 而 成 的 。 在 1787 年 的 一 天 , 布 
伦 瑞 克 一 个 偏僻 小 镇 上 的 小 学 里 ,三 年 级 的 一 个 班级 正在 上 数学 课 。 这 是 该 
校 首次 创立 的 一 个 班 ,与 其 他 班级 的 不 同 之 处 是 ,这 个 班 要 讲授 数学 课 , 类 似 
于 现在 大 家 耳熟能详 的 数学 实验 班 , 虽 然 孩 子 们 在 此 之 前 根本 就 不 知道 什么 
是 算术 。 上 课 的 老师 名 为 布 特 纳 (Buttner) ,他 对 孩子 们 的 态度 并 不 算 好 ,对 
教学 也 不 太 认 真 。 在 布 特 纳 看 来 ,自己 在 这 个 穷 乡 个 壤 教 书 真 的 是 怀 才 不 
遇 , 是 上 帝 跟 他 开 了 一 个 天 大 的 玩笑 。 

一 天 ,他 睡 眼 悍 愉 地 来 到 教室 , 头 一 天 晚上 他 跟 几 个 朋友 玩 牌 玩 了 一 个 
通宵 ,现在 恨不得 马上 倒 在 床上 美美 睡 上 一 觉 。“ 怎 么 才能 把 这 节 课 对 付 过 
去 呢 ?” 布 特 纳 在 暗暗 盘算 后 ,决定 让 这 帮 小 子 算 一 节 课 的 计算 题 。 于 是 , 布 
特 纳 在 黑板 上 写 下 了 那 道 举 世 闻 名 的 加 法 题 :“1 十 2 十 3 十 … 十 100”, 并 告诉 
同学 们 今天 上 课 的 内 容 就 是 算出 这 道 题 的 结果 ,如 果 下 课 没 做 完 就 作为 家 庭 
作业 。 就 在 布 特 纳 自 以 为 “ 阴 谋 ” 得 有 偿 ,准备 回 自己 的 屋子 睡觉 时 ,一 个 10 岁 
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的 小 男孩 站 了 起 来 说 出 了 正确 答案 “5050”。 布 特 纳 大 吃 一 惊 , 在 他 说 话 这 短 
短 几 分 钟 ,眼前 的 男孩 居然 算出 了 答案 。 布 特 纳 追问 男孩 是 怎么 算 的 ,这 个 
男孩 不 慌 不 忙 地 说 :“ 我 观察 到 1 十 100=101,2 十 99 王 101,3 十 98 王 101， 
ee ,50 十 51 一 101, 一 共有 50 个 101, 所 以 答案 是 50X 101 王 5050”。 看 到 这 
里 ,读者 会 觉得 这 个 男孩 是 个 天 才 啊 ! 不 错 ,这 个 男孩 就 是 以 后 易 易 大 名 的 
数学 家 高 斯 (C. F. Gauss) 。 不 过 也 有 人 质疑 这 个 情况 是 否 属实 。 根 据 数学 
史学 家 贝尔 (E. T. Bell) 考 证 ,当时 布 特 纳 给 孩子 们 出 的 题 没有 传说 中 这 么 简 
单 , 实 际 上 他 出 的 是 “81 297 十 81 495 十 81 693 十 … 十 100 899 一 ?” 这 是 一 道 更 
复杂 的 等 差 数 列 求 和 问题 (项 数 是 100, 公 差 为 198)。 据 贝尔 讲 , 高 斯 在 晚年 
时 常常 向 人 们 炫 炮 这 件 事 ,说 布 特 纳 刚 写 完 试题 ,他 就 算出 了 答案 ,而 其 他 小 
伙伴 才刚 加 完 前 面 几 个 数 。 

不 管 高 斯 当时 计算 的 题目 是 简单 的 还 是 复杂 的 ,这 个 故事 都 告诉 我 们 ， 
高 斯 从 很 小 的 时 候 就 已 经 开始 注意 把 握 更 本 质 的 数学 方法 ,也 就 是 我 们 所 说 
的 “算法 ”。 

这 两 年 有 一 个 非常 火 的 真人 秀 节目 ,名 为 奔跑 吧 ! 兄弟 》, 居 然 有 一 集 
里 也 出 现 了 算法 。 在 2015 年 的 第 二 季 第 二 集 ( 超 体 元 素 保卫 战 》 中 ,兄弟 团 
被 黑 衣 人 关 进 了 密室 ,要 逃 出 密室 需要 解决 各 种 设置 的 难题 ,其 中 一 间 密 室 
的 逃脱 条 件 是 需要 解决 一 道 名 为 “ 鸡 兔 同 笼 ? 的 数学 计算 题 。“ 鸡 兔 同 笼 ” 问 
题 是 中 国 古代 著名 的 趣 题 之 一 ,也 出 现在 我 们 小 学 四 年 级 的 数学 课本 (人 教 
版 ) 中 ,相似 的 问题 还 包括 和 倍 ( 差 倍 ) 问 题 ,植树 问题 , 镶 巢 问题 ,行程 问题 ， 
也 许 不 少 朋 友 都 曾 在 小 学 期 间 被 这 些 问题 “ 虐 ” 得 很 惨 。《 孙 子 算 经 ) 也 记载 
了 这 个 有 趣 的 问题 :“ 今 有 锥 兔 同 笼 , 上 有 三 十 五 头 ,下 有 九 十 四 足 , 问 锥 免 
各 几何 ?翻译 成 现在 的 白话 文 就 是 :“ 鸡 和 免 关 在 同一 个 笼子 里 ,它们 一 共 
有 35 个 头 ,94 只 脚 , 问 鸡 、 免 各 有 多 少 只 ?” 对 这 个 问题 ,相信 很 多 人 的 第 一 
反应 就 是 使 用 列 方程 等 传统 解法 。 这 里 ,我 们 来 看 一 个 思路 非常 奇 范 酷 炫 的 
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“ 抬 脚 法 ”感受 一 下 精妙 算法 的 魅力 。“ 抬 脚 法 ?的 思路 是 这 样 : 假定 笼 中 的 
鸡 和 免 都 是 训练 有 素 ,指挥 鸡 和 兔 同 时 抬 起 一 只 脚 , 一 共 是 35 只 脚 ;再 指挥 
它们 同时 抬 起 第 二 只 脚 ,这 又 是 35 只 脚 , 因 为 鸡 只 有 两 只 脚 , 所 以 鸡 就 只 能 
就 坐 地 上 了 ,只 有 兔子 还 用 两 只 脚 站 着 ;此 时 抬 起 来 的 脚 一 共 70 只 , 剩 下 的 
94 一 70 二 24 只 脚 都 是 兔子 的 ,所 以 兔子 有 24 二 2 二 12 只 , 鸡 有 35 一 12 一 
23 只 。 

算法 因 计 算数 学 而 起 ,而 现代 算法 的 应 用 范畴 早已 远 远 超出 了 数学 计算 
的 范围 ,已 经 与 每 个 人 的 生活 息息相关 。 今 天 我 们 看 到 大 部 分 轿车 都 配备 了 
电子 驻 车 制 动 系统 EPB(Electrical Park Brake) ,给 车 主 带 来 了 更 安全 简捷 的 
驾驶 体验 。 但 是 ,大 多 数 人 可 能 并 不 清楚 ,其 实 EPB 系统 也 是 由 算法 来 控 
制 的 。 

EPB 是 一 种 用 电子 控制 的 方式 来 实现 停车 制 动 的 技术 , 它 将 平时 行车 
过 程 中 的 临时 制 动 与 停车 后 长 时 间 制 动 功能 整合 在 了 一 起 。 简 单 地 说 ,这 套 
系统 的 工作 原理 与 机 械 式 手刹 相同 ,都 是 通过 在 刹车 盘 与 刹车 片 之 间 产 生 摩 
擦 力 来 达到 控制 停车 制 动 的 效果 ,只 不 过 控制 方式 从 之 前 的 机 械 式 手刹 拉杆 
变 成 了 现在 电子 按钮 。 

自动 挡 汽 车 临时 制 动 的 过 程 一 般 是 这 样 的 。 开 车 到 路 口 遇 到 红 灯 时 ,在 
没有 配备 EPB 系统 的 汽车 上 ,驾驶 员 一 般 是 踩 下 刹车 , 待 车 辆 停 稳 后 , 拉 起 
手刹 ,将 挡 位 拨 到 空挡 ,然后 松 开 脚 刹 ;等 绿灯 亮 起 时 , 换 到 前 进 挡 , 踩 油门 驶 
出 。 当 然 , 嫌 麻烦 的 驾驶 员 也 可 以 选择 一 直 踩 着 脚 镜 不 放 , 只 是 稍微 累 一 点 。 
配备 有 EPB 系统 的 汽车 就 不 一 样 了 。 同 样 是 在 路 口 遇 到 红 灯 , 驾 驶 员 踩 下 
刹车 ,车 辆 停 稳 后 ,电子 手刹 自动 启用 ,驾驶 员 松 开 脚 刹 即 可 ;等 绿灯 亮 起 , 直 
接 踩 下 油门 ,车 辆 向 前 驶 出 。EPB 系统 确实 让 驾驶 变 得 简单 了 许多 , 它 背 后 
的 算法 是 这 样 工作 的 : 当 驾驶 员 踩 下 刹车 时 ,通过 传感器 感知 速度 的 变化 ， 
车 载 电脑 中 的 算法 就 知道 车 辆 现在 正在 减速 , 当 车 辆 完全 停 下 一 段 时 间 ( 比 
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如 2 秒 钟 ) ,驾驶 员 仍 踩 着 刹车 ,算法 就 认为 需要 停车 了 ,然后 自动 启用 电子 
手刹 告诉 ?电机 卡 紧 刹 车 片 来 达到 制 动 的 目的 ,同时 ,算法 让 变速 箱 与 发 动 
机 暂时 分 离 , 切 断 发 动机 向 变速 器 输入 的 动力 ,因此 驾驶 员 可 以 松 开 脚 刹 。 
此 时 即使 在 坡 道 , 电 子 手刹 也 能 控制 车 辆 ,避免 不 必要 的 滑行 。 当 启动 时 , 轰 
驶 员 轻 轻 踩 下 油门 踏板 ,根据 传感器 传 来 的 信号 ,算法 判断 要 前 进 了 ,会 “ 通 
知 ” 变 速 箱 与 发 动机 逐渐 结合 ,车 辆 产生 向 前 的 驱动 力 , 算 法 通过 各 种 传感器 
提供 的 信息 计算 , 当 驱 动力 大 于 行驶 阻力 时 就 会 自动 释放 刹车 片 ,从 而 使 汽 
车 能 够 平稳 起 步 。 此 外 ,通过 设置 EPB, 还 可 以 让 汽车 在 较 长 时 间 停 止 时 (如 
道路 堵塞 ) ,自动 关闭 发 动机 ,在 踩 下 油门 踏板 时 自动 点 火 发 动 ,达到 节约 燃 
油 的 目的 。 这 个 过 程 看 似 复杂 ,实际 上 背后 的 算法 在 一 瞬间 就 完成 了 ,一 切 
都 发 生得 那么 自然 ,似乎 它 本 来 就 应 该 是 这 个 样子 。 


什么 是 算法 


其 实 , 人 们 在 平日 生活 中 无 时 无 刻 不 在 使 用 算法 ,只 是 人 们 早已 习 以 为 
常 ,以 至 于 并 没有 注意 到 。 在 计算 机 科学 家 看 来 ,人 类 的 思维 其 实 就 是 算法 ， 
思维 决策 的 过 程 其 实 就 是 算法 的 运行 过 程 。 试 想 一 下 ,每 天 早晨 起 来 ,决定 
穿 职业 装 还 是 休闲 装 、 穿 对 子 还 是 运动 鞋 擒 哪个 颜色 和 品牌 的 包 包 等 等 ,其 
实 都 是 大 脑 思 维 根据 今天 的 天 气 、 温 度 、 需 要 处 理 的 事项 等 参考 量 , 通 过 各 种 
分 析 处 理 得 出 的 一 个 输出 结果 ;再 比如 ,早餐 吃 什么 .出门 是 自己 开车 还 是 叫 
出 租车 、 走 哪 条 线路 等 等 ,都 是 相似 的 算法 过 程 。 只 不 过 这 个 过 程 与 生 俱 来 ， 
没有 人 会 特别 关注 。 

在 中 国 古 代 , 算 法 被 称 为 “ 术 ”, 比 如 前 面 提 到 的 《 九 章 算 术 》, 或 者 三 国 时 
期 魏 国 的 数学 家 刘 徽 提出 的 计算 圆周 率 的 方法 ,当时 称 之 为 “ 割 圆 术 ”。 算 法 
的 英文 名 称 为 "algorithm”, 来 源 于 中 世纪 的 拉丁 语 单词 “algorism”, 这 个 词 
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是 为 了 纪念 波斯 数学 家 花 拉 子 米 (AL-Khwarizmi) ,他 最 早 在 数学 上 提出 了 算 
法 的 概念 ,人 们 就 把 他 名 字 的 音 诺 作为 算法 的 名 称 , 意 思 是 “ 花 拉 子 米 提出 的 
运算 法 则 ”。 后 来 到 了 18 世纪 ,这 个 词 才 演变 为 现在 使 用 的 algorithm”。 

关于 算法 的 定义 ,也 是 形式 多 样 , 但 基本 意思 都 差不多 。 有 的 书 把 算法 
定义 为 "一 系列 的 计算 步骤 ,用 来 将 输入 数据 转换 成 输出 结果 ”; 百 度 百 科 的 
定义 是 “ 解 题 方案 的 准确 而 完整 的 描述 ,是 一 系列 解决 问题 的 清晰 指令 ,算法 
代表 着 用 系统 的 方法 描述 解决 问题 的 策略 机 制 ”而 维基 百科 对 算法 的 定义 
则 是 “一 个 关于 计算 的 有 限 长 度 的 具体 步骤 ,常用 于 计算 、 数 据 处 理 和 自动 推 
理 ,算法 应 包含 清晰 定义 的 指令 用 于 计算 函数 ”。 

不 管 这 些 描 述 的 侧重 点 和 角度 有 什么 不 同 ,所 有 的 算法 都 包括 了 几 个 共 
同 的 基本 特征 : 输入 、 输 出 、 明 确 性 、 有 限 性 有效 性 。 

怎么 来 理解 这 几 个 特征 呢 ? 我 们 用 "决定 穿 什么 衣服 ?这 个 例子 来 做 类 
比 。 一 个 算法 是 必须 要 有 零 个 .一 个 或 多 个 输入 量 的 ,这 个 输入 就 可 以 看 作 
你 衣 橱 里 衣物 的 种 类 和 数量 .当天 的 天 气 情 况 ,. 是 上 班 还 是 休息 等 ;输出 量 是 
算法 计算 的 结果 ,每 个 算法 应 该 有 一 个 以 上 的 输出 量 , 也 就 是 说 你 考虑 了 种 
种 因素 之 后 ,必须 决定 选择 哪 套 衣服 作为 当天 的 着 装 , 哪 怕 是 不 穿 衣服 也 是 
一 种 输出 ,尽管 看 起 来 很 疯狂 ;算法 的 明确 性 是 指 算法 的 描述 必须 是 无 歧义 
的 ,比如 这 个 决定 着 装 的 算法 ,对 这 个 算法 的 描述 就 只 能 是 关于 如 何 着 装 ,而 
不 是 早上 吃 什 么 ;有 限 性 是 说 算法 的 步骤 必须 是 有 限 的 ,这 个 比较 容易 理解 ， 
无 限 的 步骤 显然 永远 也 不 可 能 执行 完 , 从 早上 起 床 选 择 衣服 ,到 天 黑 了 还 没 
选 出 来 ,这 绝对 是 一 件 匪 夷 所 思 的 事情 ,别人 会 认为 你 脑子 出 了 问题 ;最 后 是 
有 效 性 ,这 是 说 算法 的 操作 和 结果 是 能 够 实现 的 ,如 果 最 后 得 出 的 结果 是 你 
衣 橱 里 没有 的 衣服 ,显然 这 是 个 无 效 的 算法 。 

从 古 至 今 ,涌现 出 的 算法 何止 万 万 千 千 。 在 这 其 中 ,有 精妙 的 算法 ,有 一 
般 的 算法 ,也 有 拙劣 的 算法 。 比 如 ,计算 1 十 2 十 3 十 … ,一 直 加 到 100, 最 简单 
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粗暴 的 方法 就 是 老 老实 实 一 个 数 一 个 数 地 算 ,当然 用 这 样 的 “ 笨 办 法 ”也 能 算 
出 来 ,还 要 保证 计算 过 程 中 不 能 出 错 , 但 我 们 很 难 将 这 样 的 算法 称 为 一 个 好 
算法 。 从 1 到 100 还 可 以 用 手工 计算 ,但 当 长 度 增加 到 一 干 . 一 万 、 甚 至 是 一 
亿 , 那 要 算 到 什么 时 候 ? 所 以 ,总 有 聪明 的 人 ,比如 高 斯 ,能 够 发 现 计 算 等 差 
数列 的 好 方法 ,不 管 有 多 少数 ,都 能 在 很 短 时 间 内 得 到 结果 。 具 体 到 某 一 个 
算法 是 好 是 坏 , 这 需要 一 个 评判 标准 。 一 般 来 说 ,一 方面 是 看 算法 运行 的 速 
度 , 也 就 是 多 长 时 间 能 够 得 到 结果 ,当然 是 越 快 越 好 ; 另 一 方面 是 看 算法 运行 
需要 占用 的 存储 空间 有 多 大 ,因为 算法 一 般 在 计算 机 中 运行 ,而 计算 机 的 内 
存 空间 是 有 限 的 。 就 像 人 的 大 脑 ,在 同一 时 刻 ,大脑 是 在 处 理 多 个 任务 的 , 比 
如 , 某 个 码 农 可 以 一 边 敲 代码 一 边 喝 咖 啡 ,同时 还 在 盘算 下 班 后 约 几 个 死党 
找 地 方 措 串 。 假 如 一 个 任务 就 把 大 脑 撑 满 了 ,其 他 所 有 事 , 诸 如 动 动手 指 、 说 
话 等 都 不 能 做 了 , 那 显 然 这 样 的 算法 是 存在 重大 缺陷 的 。 关 于 如 何 评价 算 
法 ,这 里 先 简单 让 大 家 有 个 概念 ,我 们 在 后 面 还 会 专门 叙述 。 


统治 世界 的 十 大 算法 


2014 年 ,加 拿 大 未 来 主义 者 、 生 物 伦理 学 家 兼 科学 作家 乔治 . 多 沃 斯 基 
(George P. Dvorsky) 推 出 了 一 个 关于 算法 的 排行 榜 , 称 为 “统治 世界 的 十 大 
算法 ”, 从 计算 机 和 互联 网 的 角度 评 出 了 与 人 们 生活 息息相关 的 十 个 算法 。 
高 居 榜首 的 就 是 Google 公司 创始 人 之 一 的 拉 里 ， 佩 奇 (Larry Page) 发 明 的 
PageRank 算法 。 这 是 一 个 计算 网 页 排名 的 算法 ,体现 网 页 的 相关 性 和 重要 
性 ,Google 搜索 给 出 的 搜索 结果 就 是 基于 这 个 算法 ,这 可 是 Google 公司 发 
家 致富 的 基础 ,其 重要 性 可 以 与 可 口 可 乐 的 配方 相提并论 ,在 本 书 第 5 章 还 
会 对 这 个 算法 做 详细 介绍 。 

排名 第 二 的 是 Facebook 公司 的 News Feed, 这 是 一 个 新 闻 推 送 的 算法 ,可 
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以 看 作 美 国 版 的 “今日 头条 ”。 它 根据 人 们 的 喜好 不 同 将 不 同 的 内 容 推 送 给 用 
户 , 很 多 美国 人 都 承认 “News Feed 是 我 们 最 喜欢 浪费 时 间 的 地 方 ”。 而今， 
News Feed 的 广告 业务 也 为 Facebook 带 来 了 每 天 近 4000 万 美元 的 收入 。 

排名 第 三 的 是 匹配 算法 ,目前 在 线 交 友 、 婚 恋 匹配 等 已 经 成 为 动 辑 几 十 
上 百 亿美 元 的 产业 ,匹配 算法 在 其 中 功 不 可 没 , 在 本 书 第 3 章 将 对 匹配 做 详 
细 介 绍 。 

位 于 第 四 位 的 是 与 安全 相关 的 数据 采集 、 加 解密 算法 。 通 过 斯 诺 登 ,我 
们 已 经 知道 了 美国 国家 安全 局 (NSA) 及 其 小 伙伴 已 经 暗中 监控 了 数 百 万 对 
此 一 无 所 知 的 无 境 民 众 。 算 法 在 这 其 中 扮演 了 很 不 光彩 的 角色 ,当然 ,算法 
对 此 也 很 无 奈 , 它 也 是 做 牛 做 马 的 悲情 角色 。 

第 五 位 是 推荐 算法 , 跟 人 们 平日 网 络 购物 、 看 视频 等 活动 息息相关 。 人 
们 在 淘宝 或 京东 购买 了 衣物 、 书 籍 ,或 是 在 Netflix、 爱 奇 艺 看 了 某 个 电影 或 
连续 剧 , 这 些 网 站 的 推荐 算法 就 会 记录 这 些 浏览 和 购买 信息 ,然后 利用 这 些 
信息 “猜测 某 个 人 的 喜好 ,根据 猜测 结果 为 人 们 推荐 商品 。 所 以 很 多 人 会 发 
现 , 当 再 次 登录 淘宝 或 京东 时 ,系统 会 向 你 推荐 和 你 曾经 浏览 过 或 买 过 的 产 
品类 似 的 产品 ,因为 系统 会 认为 你 曾经 买 过 ,所 以 你 再 次 购买 的 可 能 性 会 变 
大 。 读 者 可 以 自己 判断 这 样 的 推荐 算法 是 否 会 让 你 满意 。 在 本 书 第 5 章 也 
将 对 推荐 算法 做 详细 介绍 。 
排名 第 六 的 是 Google 公司 的 Adwords ,这 是 一 种 通过 使 用 Google 关键 
字 广告 来 推广 网 站 的 算法 。 
排名 第 七 和 第 八 的 分 别 是 股票 交易 算法 和 MP3 压缩 算法 。MP3 是 一 
种 音频 压缩 技术 ,于 1987 年 由 德国 的 一 个 研究 组 织 Fraunhofer-Gesellschaft 
发 明 并 标准 化 , 它 能 将 音频 以 1: 10 甚至 1: 12 的 压缩 率 压 缩 ,从 而 大 大 降 
低 了 存储 音频 文件 所 需 的 容量 。 
排名 第 九 的 预测 分 析 算 法 ,这 是 一 种 让 人 细 思 极 恐 、 会 想起 电影 (少数 
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派 报告 》 的 技术 。 虽 然 这 种 技术 还 没有 主宰 我 们 的 世界 ,但 越 来 越 多 的 和 警 
察 机 构 正 在 使 用 这 一 预测 技术 。 据 说 在 2010 年 ,美国 孟菲斯 市 警察 局 通 
过 使 用 IBM 公司 的 预测 分 析 软 件 CRUSH (Criminal Reduction Utilizing 
Statistical History) ,使 当地 恶性 案件 的 发 生 率 降低 了 超过 30% ,其 中 包括 
15% 的 暴力 犯罪 。 很 多 其 他 国家 和 地 区 也 开始 关注 这 一 技术 ,包括 洛 杉 
矶 、 圣 克 鲁 斯 查尔斯 顿 等 地 方 也 开始 了 试点 。 这 种 算法 结合 了 数据 采集 、 
统计 分 析 等 方法 ,发 现 所 在 城市 的 犯罪 特点 ,并 对 可 能 出 现 的 犯罪 "热点 ” 
进行 预测 ,从 而 可 以 “积极 地 配置 资源 和 分 配 人 手 ,提高 人 力 物 力 的 使 用 效 
率 ,提高 公众 安全 ”。 

位 居 末 位 的 是 调 音 算法 ,这 种 算法 最 初 是 用 于 处 理 地 震 数 据 ,后 来 人 们 
意外 发 现在 处 理 歌 声 或 乐器 的 音色 时 有 很 好 的 效果 。 美 国 女 歌手 雪 儿 
(Cher) 演 唱 的 “Believe”, 被 认为 是 第 一 首 使 用 调 音 的 流行 歌曲 。 

对 于 “统治 世界 的 十 大 算法 ”, 也 有 很 多 人 提出 不 同意 见 , 认 为 这 些 算法 
都 是 在 应 用 层面 的 ,是 建立 在 纯 算 法 的 基础 上 的 ,不 是 真正 意义 上 发 挥 基础 
作用 的 算法 ,而且 有 为 互联 网 公司 打 广 告 的 嫌疑 。 因 此 ,那些 坚持 “正统 ”的 
人 就 搞 了 一 个 “真正 统治 世界 的 十 大 算法 ”的 榜 单 ,包括 排序 算法 、 传 里 叶 变 
换算 法 . 迪 杰 斯 特 拉 算法 .RSA 算法 、 哈 希 算法 等 。 这 些 算法 的 确 在 很 多 领 
域 发 挥 着 重要 作用 ,其 中 一 些 我 们 会 在 后 面 的 章节 中 介绍 。 


算法 的 载体 一 一 图 灵 和 图 灵机 


计算 机 没什么 用 ,它们 只 会 告诉 你 答案 。 
一 一 巴 勃 罗 ， 毕加索 
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图 灵 的 甜点 


前 文 讲 到 了 各 种 形形色色 的 算法 ,不 管 是 应 用 类 的 还 是 基础 类 的 ,必然 
需要 一 个 承载 其 运转 的 载体 ,就 好 比 大 脑 是 人 类 思维 的 载体 。 现 实 中 算法 的 
载体 ,就 是 各 种 计算 机 ,算法 与 计算 机 之 间 是 密 不 可 分 的 关系 ,因此 , 讲 算法 
必然 要 谈 到 图 灵 和 图 灵机 ,以 及 后 来 的 图 灵 测 试 和 人 工 智 能 。 

艾 伦 . 麦 席 森 ' 图 灵 (Alan Mathison Turing) 是 英国 数学 家 、 逻 辑 学 家 ， 
被 称 为 计算 机 之 父 人工 智能 之 父 。 也 许 很 多 人 是 通过 电影 知道 图 灵 这 个 人 
的 。2015 年 2 月 23 日 上 午 , 第 87 届 奥 斯 卡 金 像 奖 颁奖 典礼 在 好 莱 坞 杜 比 剧 
院 举行 ,其 中 有 一 部 名 为 《模仿 游戏 》(The Imitation Game) 的 传记 电影 斩获 
最 佳 改 编剧 本 奖 , 以 及 包括 最 佳 影片 .最 佳 导演 、 最 佳 男 主角 、 最 佳 女 配角 在 
内 的 7 项 提名 。 这 部 影片 主要 讲述 了 “计算 机 之 父 ” 图 灵 的 传奇 人 生 , 着 重 展 
示 了 图 灵 帮 助 盟 军 破译 德国 加 密 机 “ 英 格 玛 ”, 从 而 扭转 二 战 战 局 的 经 历 。 当 
然 , 作 为 艺术 作品 ,这 部 电影 也 存在 一 些 拔高 或 偏颇 之 处 ,但 图 灵 的 巨大 贡献 
和 功绩 是 为 世人 所 公认 的 。 

需要 更 正 一 下 的 是 ,最 先 为 破解 英 格 玛 密 码 机 做 出 重要 贡献 的 是 波兰 人 
雷 耶 夫 斯 基 (Marian Rejewski) 。 在 这 里 ,不 得 不 感叹 波兰 人 搞 情 报 的 能 力 。 
波兰 人 通过 间谍 活动 得 到 了 英 格 玛 密码 机 的 工作 原理 和 内 部 构造 的 资料 ,以 
及 德军 对 英 格 玛 密码 机 的 操作 守则 。 根 据 这 些 资料 和 平日 里 截获 的 德军 电 
文 , 雷 耶 夫 斯 基 破 译 了 德军 日 密 钥 的 全 部 内 容 , 可 以 说 与 德军 中 的 报 务 员 处 
在 了 完全 对 等 的 地 位 。 在 1939 年 德军 入 侵 波兰 前 夕 ,波兰 人 将 英 格 玛 密 码 
机 的 复制 品 和 破解 方法 提供 给 了 英国 和 法 国 。 如 果 历 史 就 这 样 不 变 , 那 其 实 
就 没有 图 灵 什 么 事 了 。 

在 二 战 爆发 前 夕 ,为 了 战争 的 需要 ,德军 又 采取 了 很 多 措施 来 加 强 英 格 
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玛 密 码 机 的 安全 性 ,使 得 波兰 人 前 面 的 破解 方法 全 部 失效 了 。 二 战 开始 后 ， 


对 英国 来 说 ,破解 英 格 玛 密 码 机 的 工作 就 显得 非常 重要 了 。 此 时 ,图 灵 大 神 
开始 登场 。 根 据 波兰 人 提供 的 资料 ,他 意识 到 波兰 人 的 破解 方法 过 于 依赖 德 


经 过 干 难 万 险 ,图 灵 终 于 设计 并 制造 出 了 
破解 英 格 玛 密码 机 的 机 器 一 一 * 图 灵 甜 点 ” 
(Turing Bombe)。“ 图 灵 甜 点 ”的 样子 如 图 1.5 
所 示 。 这 个 机 器 里 包含 很 多 三 个 一 组 的 转盘 ， 
每 组 转盘 都 相当 于 一 台 英 格 玛 密码 机 ,一 台 标 
准 的 “图 灵 甜 点 ?共有 36 组 这 样 的 转盘 。 机 器 
在 进行 暴力 破解 时 ,如 果 遇 到 可 能 的 解 , 它 就 会 
停 下 来 ,以 便 工作 人 员 进 行 记 录 ; 而 它 没 有 停 下 
来 的 时 候 , 人 们 就 只 能 站 在 旁边 等 待 。 那 么 图 


国人 操作 方式 上 的 漏洞 。 图 灵 的 思路 是 ,不 管 英 格 玛 密码 怎么 复杂 , 它 也 是 
机 器 创造 出 来 的 ,只 有 用 机 器 才能 战胜 ,人 类 的 任务 就 变 为 找到 并 设计 出 这 
个 机 器 的 工作 原理 和 优化 机 器 进行 的 运算 量 。 他 想 要 做 的 是 一 种 更 纯粹 和 
直接 的 暴力 破解 一 一 发 明 一 种 更 强大 的 机 器 去 战胜 英 格 玛 密码 机 。 


灵 为 什么 能 够 想到 用 机 器 来 对 付 机 器 的 思路 图 15 图 灵 天 点 


呢 ? 这 其 实 还 是 跟 * 图 灵机 ?的 思想 有 关 。 


图 灵 的 精彩 人 生 


图 灵 出 生 于 英国 一 个 没落 的 贵族 家 族 ,但 他 这 一 支 


属于 旁 系 ,不 能 继承 


萎 位 ,没有 领地 ,也 不 能 继承 多 少 财产 。 这 样 的 劳 系 成 员 大 多 都 成 了 神职 人 


员 或 者 英 属 殖民 地 的 公务 员 , 图 灵 的 父亲 就 是 一 位 服务 


F 印 


度 边 远 地 区 的 基 


层 行政 人 员 。1912 年 6 月 ,图 灵 的 父母 回 到 伦敦 休假 期 间 , 生 下 了 图 灵 。 在 
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他 一 岁 的 时 候 , 因 为 父母 要 返回 印度 继续 工作 ,图 灵 和 他 哥哥 被 交 给 居住 在 
英格兰 南岸 的 一 对 退役 陆军 上 校 夫 妇 照 顾 , 这 使 得 他 的 成 长 过 程 缺乏 了 必要 
的 关爱 ,对 他 以 后 的 性 格 和 行为 产生 了 比较 大 的 影响 。 

后 来 ,图 灵 的 母亲 回 到 英国 ,他 才 得 以 离开 寄养 家 庭 , 跟 母亲 生活 在 一 
起 。 图 灵 在 少年 时 代 就 展现 出 对 数学 的 热爱 和 独特 的 创造 能 力 。 他 在 13 岁 
那 年 考 上 了 伦敦 有 名 的 舍 伯 恩 (Sherborne) 公 学 ,接受 了 良好 的 中 等 教育 。 
1927 年 ,在 图 灵 15 岁 的 时 候 , 为 了 帮助 母 杀 理解 爱 因 斯 坦 的 相对 论 , 他 为 关 
于 爱 因 斯 坦 一 部 讲述 相对 论 的 著作 写 了 一 个 内 容 提 要 ,表现 出 非凡 的 数学 水 
平和 理解 力 ,但 他 也 因为 对 文科 很 不 重视 ,以 至 于 文科 成 绩 过 于 糟糕 ,经 常 遭 
到 老师 的 责骂 。 也 就 是 在 舍 伯 恩 公 学 的 这 段 时 间 ,图 灵 爱 上 了 他 的 金发 同学 
克 里 斯 多 夫 ' 莫 科 姆 (Christopher Morcom) ,此 时 ,他 才 意 识 到 自己 是 一 个 
同性 恋 者 。 在 那个 时 候 , 同 性 恋 在 英国 算是 一 种 严重 的 罪行 ,这 为 图 灵 以 后 
悲惨 的 遭遇 坦 下 了 伏笔 。 很 不 幸 ,在 中 学 毕业 前 的 寒假 , 莫 科 姆 感染 了 结核 
病 并 很 快 离世 。 这 个 变故 差点 使 图 灵 崩 溃 , 他 自 此 以 后 变 得 更 加 独 来 独 往 ， 
再 也 无 法 轻易 与 他 人 建立 起 亲密 关系 。 

遭受 这 些 打击 后 ,跑步 成 了 图 灵 释 放 压 力 和 追求 内 心平 静 的 唯一 方式 。 
即使 成 名 以 后 ,他 也 一 直 坚 持 这 个 习惯 ,在 工作 忙碌 时 ,他 也 想方设法 跑步 ， 
比如 从 家 里 跑 到 工作 的 地 方 ,跑步 到 会 议 现场 参加 科学 会 议 ,这 让 他 的 同事 
们 都 觉得 不 可 思议 。 图 灵 的 传记 作家 安 德 烈 . 霍 奇 (Andrew Hodges) 这样 
说 道 :“ 最 关键 的 是 ,他 跑 得 比 一 些 交 通 工 具 还 要 快 .” 更 有 意思 的 是 ,如 果 不 
是 腿 伤 的 原因 ,图 灵 还 很 有 可 能 跑 进 1948 年 的 伦敦 奥运 会 。 

图 灵 的 个 人 马拉松 最 好 成 绩 是 2 小 时 46 分 03 秒 ,但 因为 持续 训练 和 略 
显 僵硬 的 跑步 姿势 ,他 遭遇 了 腿 伤 ,以 致 错过 了 业余 田 协 在 1948 年 6 月 举办 
的 伦敦 奥运 会 马拉松 选拔 赛 。 那 一 年 ,伦敦 奥运 会 马拉松 比赛 冠军 的 成 绩 是 
2 小 时 34 分 52 秒 , 英 国 选 手 拿 到 了 银牌 ,而 代表 英国 出 战 的 第 二 好 选手 成 
绩 也 仅仅 是 3 小 时 09 分 , 远 不 如 图 灵 。 
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在 舍 伯 恩 公 学 的 最 后 一 年 ,图 灵 获 得 了 剑桥 大 学 国王 学 院 的 奖学金 ,他 
于 1931 年 进入 该 学 院 学 习 数学 。 图 灵 用 获得 的 奖学金 买 了 三 本 书 , 其 中 一 
本 是 约翰 冯 ，… 诺 依 曼 (John von Neumann) 所 著 的 《量子 力学 的 数学 基础 》， 
这 本 书 中 描述 了 在 亚 原子 层面 发 生 的 事件 如 何 受 到 统计 概率 的 控制 原理 ,这 
对 图 灵 以 后 的 学 术 道 路 产生 了 深远 的 影响 。 在 此 后 很 长 一 段 时 间 , 图 灵 都 一 
直 在 钻研 “人 类 大 脑 与 确定 性 机 器 之 间 是 否 存在 根本 区 别 ” 这 个 问题 ,他 后 来 
逐步 得 出 的 结论 是 ,人 与 机 器 之 间 的 界线 比 他 原来 想象 的 更 加 模糊 。 

德国 天 才 数 学 家 大 卫 : 希 尔 伯 特 (David Hilbert) 在 1928 年 的 一 场 数学 大 
会 上 ,提出 了 关于 任意 数学 形式 系统 的 三 个 基本 问题 。 前 两 个 问题 在 之 后 三 
年 不 到 的 时 间 , 就 被 来 自 奥地利 的 数学 家 、 时 年 25 岁 的 库 尔 特 ， 哥 德 尔 (Kurt 
G6del) 解 决 了 。 希 尔 伯 特 三 个 问题 只 剩 下 最 后 一 个 :“ 系 统 是 可 判定 的 吗 ? 有 
没有 可 以 判定 特定 命题 是 否 可 证 明 的 方法 ? 会 不 会 出 现 某 些 陈述 存在 不 可 判 
定 状态 的 可 能 性 ?” 希 尔 伯 特 本 人 把 这 第 三 个 问题 称 为 “判定 问题 "。1935 年 ， 
在 剑桥 大 学 数学 教授 麦克 斯 ， 纽曼 (Max Newman) 开 设 的 数理 逻辑 课 上 ,图 灵 
第 一 次 听 到 了 希 尔 伯 特 的 判定 问题 。 纽 曼 教授 根据 自己 的 理解 给 出 了 对 判定 
问题 的 表述 :“ 有 没有 一 种 “机 械 方式 ?可 以 用 于 判定 某 个 逻辑 命题 是 否 可 证 ?” 
图 灵 开始 对 判定 问题 产生 了 兴趣 ,他 非常 喜欢 纽曼 教授 提出 的 “机 械 方式 ”的 概 
念 。 图 灵敏 锐 地 意识 到 ,解决 这 个 问题 的 关键 ,在 于 对 这 种 “机 械 方式 ”的 严格 
定义 。 可 以 说 ,这 个 概念 在 一 定 程度 上 促进 了 以 后 “图 灵机 ”思想 的 诞生 。 


跑步 后 的 灵感 一 一 图 灵机 


1935 年 夏季 的 一 天 傍晚 ,图 灵 又 像 往常 一 样 沿 着 伊利 河畔 跑步 。 在 以 
每 英里 @ 4 分 半 的 速度 跑 完了 大 约 6. 2 英里 的 路 程 后 ,图 灵 躺 在 格 兰 切 斯 特 


@ 1 英里 一 1.609 344km。 
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草 旬 的 苹果 树 下 ,一 边 享受 落日 的 余晖 ,一 边 潜 心思 考 着 一 个 困惑 已 久 的 问 
题 。 关 于 “机 械 方式 ”的 定义 ,他 还 是 觉得 “用 机 器 来 完成 计算 ”是 一 个 可 行 的 
方式 。 其 实 ,“ 用 机 器 来 代替 人 工 进行 计算 ”的 想法 并 不 新 鲜 。17 世纪 ,德国 
哲学 家 ,数学 家 莱 布 尼 茨 (Gottfried Wilhelm Leibniz) 就 曾经 设想 过 用 机 械 计 
算 来 代替 哲学 家 的 思考 。 图 灵 的 设想 与 先贤 们 略 有 不 同 。 在 他 的 设想 里 ， 
这 个 机 器 必须 足够 简单 ,要 简单 到 能 够 用 逻辑 清晰 的 公式 来 描述 它 的 行为 ， 
也 要 能 够 造 出 实物 ; 它 又 要 做 到 足够 复杂 ,要 具备 能 够 完成 所 有 机 械 能 完成 
的 运算 。 图 灵 打 算 构造 的 是 一 种 能 够 产生 复杂 行为 的 简单 机 器 。 

不 知道 是 不 是 跑步 带 来 的 效果 ,图 灵 那 一 天 的 思路 特别 清晰 ,以 前 一 些 
卡 顿 的 地 方 也 都 移 然 开朗 。 很 快 ,在 他 的 头脑 中 匀 勤 出 了 一 种 机 器 的 模型 ， 
这 正 是 他 梦 寨 以 求 的 样子 。 图 灵 一 跃 而 起 ,兴奋 地 挥舞 着 双手 ,虽然 他 并 没 
有 被 苹果 掉 下 来 砸 在 头 上 ,但 图 灵感 觉 到 确实 是 有 如 神助 。 

图 灵 回 到 学 校 , 洗 了 一 个 舒 舒服 服 的 热 水 澡 ,平复 了 一 下 心情 ,然后 马上 
到 工作 室 记 下 了 当时 的 思路 。 图 灵 的 基本 思想 是 用 机 器 来 模拟 人 类 用 纸 笔 
进行 数学 计算 的 过 程 ,他 假想 出 一 台 结构 非常 简单 的 机 器 ,这 种 机 器 由 两 间 
分 组 成 : 一 个 读 写 头 ,一 条 无 限 长 的 纸 带 , 纸 带 分 成 一 个 一 个 小 方 格 ,每 个 方 
格 中 只 能 有 0 和 1 两 种 符号 。 读 写 头 可 以 在 纸 带 上 移动 , 读 取 或 改变 纸 带 格 
子 上 的 信息 ,但 每 次 只 能 对 着 纸 带 上 的 一 个 格子 。 读 写 头 可 以 处 于 不 同 的 状 
态 ,但 状态 的 数目 是 由 状态 转移 表 确 定 的 ,并 且 是 有 限 的 。 每 一 时 刻 , 读 写 头 
从 纸 带 上 读 入 一 个 方 格 的 信息 ,然后 根据 状态 转移 表 查 找 内 部 的 固定 程序 ， 
根据 程序 输出 信息 到 纸 带 的 方 格 上 ,并 转换 内 部 状态 ,然后 移动 。 在 读 写 头 
的 所 有 状态 中 ,有 一 个 特殊 的 “停机 ?状态 , 读 写 头 如 果 处 于 停机 状态 ,就 会 停 
止 工作 ,否则 它 会 一 直 运行 下 去 。 实 际 上 ,这 台 机 器 最 关键 的 地 方 就 在 于 状 
态 转移 表 , 它 指示 读 写 头 的 状态 及 其 相应 格子 里 的 信息 如 何 变化 ,可 以 说 , 状 
态 转 移 表 描述 了 这 台 机 器 执行 的 算法 。 需 要 注意 的 是 ,图 灵机 并 不 是 一 台 真 
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实 的 机 器 ,而 是 一 种 抽象 的 计算 模型 。 虽 然 是 抽象 模型 ,仍然 有 人 能 够 把 图 
灵机 制作 出 来 ,图 1. 6 就 是 乐高 公司 制造 的 一 台 玩 具 图 灵机 。 


16 乐高 玩具 版 图 灵机 


实际 上 ,这 台 机 器 的 运转 过 程 跟 人 类 笔算 乘法 的 过 程 非常 类 似 : 在 每 个 
时 刻 ,我 们 的 注意 力 都 集中 在 笔尖 上 ,根据 眼睛 看 到 的 信息 移动 笔尖 ,在 纸 上 
写 下 符号 ,而 指示 我 们 怎么 写 、 写 什么 的 则 是 我 们 早已 熟悉 的 运算 法 则 。 在 
这 里 ,计算 用 的 纸张 就 是 纸 带 , 读 写 头 就 是 人 和 他 手中 的 笔 ,状态 转移 表 就 是 
乘 / 加 法 规则 表 , 读 写 头 的 状态 就 是 大 脑 当前 的 精神 状态 。 

1936 年 9 月 ,图 灵 应 邀 到 美国 普林斯顿 大 学 高 级 研究 院 学 习 , 在 这 里 ， 
他 结识 了 数学 家 阿 隆 佐 . 丘 奇 (Alonzo Church) 并 同 他 一 起 工作 。 丘 奇 在 判 
定 问 题 上 的 研究 一 直 领 先 于 图 灵 , 但 他 胸怀 坦荡 ,乐于 提携 后 辈 。 图 灵 在 
1937 年 将 自己 的 研究 成 果 写 成 论文 4 论 可 计算 数 及 其 在 判定 问题 上 的 应 
用 》, 并 将 论文 副本 送 交 6 位 知名 学 者 审阅 。 只 有 丘 奇 认真 阅读 了 图 灵 的 论 
文 , 他 非常 欣赏 图 灵 的 工作 ,不 仅 给 出 很 多 好 的 建议 ,还 将 图 灵 设 计 的 计算 机 
器 命名 为 “图 灵机 ?。 从 此 ,图 灵机 ?” 横 空 出 世 ,也 标志 着 这 位 年 仅 24 岁 的 年 
轻 人 的 名 字 将 被 永远 刻 在 数字 时 代 最 为 重要 的 里 程 碑 上 。 

图 灵机 的 思想 对 于 后 来 现代 计算 机 的 发 展 影响 非常 深远 。 共 同 创立 
TCP/IP 协议 的 “互联 网 之 父 ” 温 特 。 配 夫 (Vint Cerf) 与 罗伯特 。 卡 恩 
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(Robert E. Kahn) 在 一 篇 纪念 图 灵 的 文章 里 写 道 : 

如 果 他 能 够 活 到 今年 ,不 知 他 看 到 今日 的 景象 会 有 如 何 的 感想 ,又 能 为 我 们 
提出 哪些 值得 思考 的 问题 。 我 花 了 一 华 子 研究 计算 机 和 网 络 ,可 是 时 时 还 会 期 
盼 图 灵 能 够 在 身边 回答 我 的 疑问 。 相 信和 如 果 有 他 在 ,很 多 问题 都 能 够 迎刃而解 。 


从 图 灵 测 试 到 人 工 智 能 


计算 机 会 不 会 思考 这 个 问题 就 像 问 潜水 艇 会 不 会 游泳 一 样 。 
一 一 迪 杰 斯 特 拉 , 图 灵 奖 获得 者 


你 在 跟 谁 对 话 


1950 年 ,我们 的 图 灵 大 神 又 发 表 了 一 篇 划时代 的 论文 4 计算 机 械 与 智 
力 》, 在 这 篇 文章 里 讨论 了 创造 真正 的 智能 机 器 的 可 能 性 。 他 在 文章 的 开篇 
就 说 道 :“ 我 建议 大 家 考虑 这 样 一 个 问题 :“ 机 器 能 思考 吗 ?””。 这 个 问题 非 
常 不 好 回答 ,并 不 是 简单 地 说 “能 ”或 者 “不 能 ”就 可 以 了 。 这 个 问题 真正 的 难 
点 在 于 怎么 精确 定义 "思考 "这 个 概念 ,如 果 纠 绰 于 这 个 定义 问题 ,很 可 能 陷 
入 哲学 讨论 的 “泥沼 ,偏离 了 问题 的 本 来 目的 。 很 显然 ,图 灵 也 看 到 了 这 一 
点 ,于 是 他 很 “机 智 ? 地 绕 过 了 这 个 定义 ,提出 了 一 个 可 操作 性 很 强 的 标准 : 
如 果 一 台 机 右 表 现 得 和 一 个 会 思考 的 人 类 一 样 ,旁人 无 法 区 分 , 那 我 们 就 可 
以 当 作 它 是 在 “思考 ”。 这 就 是 著名 的 “图 灵 测 试 ”, 或 者 说 ,是 一 台 机 器 模仿 
人 思考 的 过 程 , 模 仿 得 越 逼真 ,就 说 明 它 越 “ 会 思考。 而 机 器 所 有 的 这 些 模 
仿 行 为 和 思考 过 程 , 实 质 是 算法 ,是 算法 赋予 了 机 器 智能 ,所 以 说 图 灵 测 试 的 
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真正 对 象 其 实 是 算法 。 

到 了 1952 年 ,图 灵 提 出 了 一 个 具体 的 测试 方法 : 让 机 器 与 人 类 进行 对 
话 ,当然 对 话 的 人 看 不 到 他 的 对 手 ( 关 在 小 黑 屋 里 ), 只 能 根据 对 话 过 程 来 判 
断 ,如 果 有 足够 多 的 人 (图 灵 设 定 的 标准 是 30%) 认 为 跟 自 己 说 话 的 是 人 类 
而 不 是 机 器 ,那么 机 器 就 成 功 通过 图 灵 测 试 。 从 这 个 方法 可 以 看 出 来 ,图 灵 
测试 的 真正 核心 是 在 于 “机 器 是 否 能 够 在 智力 行为 上 表现 得 和 人 类 无 法 区 
分 ”, 至 于 具体 的 形式 是 对 话 还 是 唱歌 ,或 是 别 的 什么 都 无 所 谓 。 图 灵 测 试 是 
人 工 智能 哲学 方面 第 一 个 严肃 提案 ,而 这 个 方法 也 在 后 世 被 发 扬 光 大 ,成 为 
图 灵 测 试 的 唯一 方法 。 

图 灵 本 人 确信 机 器 是 可 以 思考 的 ,他 还 预言 “在 20 世纪 末 , 一 定 会 有 计 
算 机 通过 图 灵 测 试 “ 到 2000 年 将 会 出 现 足够 好 的 计算 机 ,能 够 在 长 达 5 分 
钟 的 提问 中 全 部 回答 正确 *。 著 名 的 科普 网 站 一 一 科学 松鼠 会 ,曾经 发 布 过 
一 张 名 为 “第 一 次 成 功 的 克 林 贡 下 图 灵 测 试 的 漫画 ,生动 地 描绘 了 图 灵 测 试 
的 过 程 (图 1.7)。 

公认 的 计算 机 首次 通过 图 灵 测 试 的 时 间 是 2014 年 6 月 7 日 一 一 图 灵 逝 
世 60 周年 的 纪念 日 , 比 图 灵 预 料 的 稍微 晚 了 一 点 点 。 在 英国 皇家 学 会 举行 
的 “2014 图 灵 测 试 大 会 ”上 ,一 个 由 俄罗斯 团队 开发 的 智能 聊天 程序 ,模仿 成 
一 个 13 岁 的 名 叫 “ 尤 金 . 古 斯 特 最 ”(Eugene Goostman) 的 乌克兰 男孩 ,通过 
了 图 灵 测 试 。 这 次 大 会 共有 5 个 聊天 机 器 人 参赛 ,其 中 , 尤 金 被 33% 的 评委 
判定 为 人 类 ,超过 了 图 灵 设 置 的 30% 的 标准 。 

2014 年 5 月 ,微软 公司 Bing 搜索 中 国 团队 发 布 了 智能 聊天 机 器 人 “微软 
小 冰 ”, 开 始 了 历史 上 最 大 规模 的 图 灵 测 试 。 据 微软 高 级 研究 员 和 科学 家 王 


@ 克 林 贡 ,英语 Klingons, 是 著名 的 科幻 影视 (星际 迷航 》 中 一 个 好 战 的 外 星 种 族 , 几 乎 
人 人 都 是 战士 。 
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你 是 个 克 林 贡 人 还 是 台电 脑 ? 
一 个 真正 的 战士 绝 不 会 问 出 这 样 的 问题 。 
管 他 呢 ， 回 答 我 的 问题 。 


| 我 旅行 在 鲜血 汇 成 的 河流 之 中 ! 
不 ， 说 正经 的 ， 你 都 有 哪些 业余 爱好 ? 
| 我 所 热爱 与 谓 户 的 唯 有 政 人 的 鲜血 1 


我 说 伙计 ， 你 为 叭 这 人 么 语 动 ? 


RAAAWR $42 


为 什么 突然 朝 我 大 喊 大 00? 


我 不 想 再 玩 这 个 测试 了 。 


Ee 


第 一 次 成 功 的 
克 林 贡 图 灵 测 试 


17 图 灵 测 试 漫画 


永 东 披 露 ,微软 小 冰 可 以 像 人 一 样 回答 问题 ,可 以 就 任何 话题 与 人 们 进行 交 
流 , 还 能 提出 问题 甚至 思考 问题 ,比如 ,如 果 用 户 发 出 一 张 手指 被 割 伤 的 图 
片 ,微软 小 冰 会 问 是 不 是 做 饭 弄 伤 的 ,还 会 问 伤口 疼 不 疼 。 微 软 小 冰 自 上 线 
以 来 ,目前 已 经 进化 到 第 四 代 , 每 天 约 有 数 百 万 人 通过 各 种 平台 与 微软 小 冰 
对 话 ,当然 人 们 最 喜欢 的 还 是 从 各 方面 调戏 微软 小 冰 , 互 联网 上 有 非常 多 调 
戏 微软 小 冰 的 对 话 截图 (图 1. 8)。 微 软 小 冰 也 很 有 意思 ,她 如 果 碰 到 自己 不 
了 解 的 东西 ,会 尝试 进行 掩饰 ,如 果实 在 掩饰 不 了 ,她 还 会 像 人 一 样 恼 羞 成 
怒 。 据 美国 科技 媒体 GeekWire 报道 ,已 经 有 数 百 万 中 国 用 户 向 微软 小 冰 表 
白 过 ,大 约 25% 或 1000 万 人 在 使 用 这 项 服务 时 说 过 “我 爱 你 ”。 
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sr 水 


区 高 冷 ， 不 呵呵 ， 不 白 富美 ， 
我 就 是 我 ， 颜 色 不 一 样 的 烟火 


让 本 你 咋 不 谁 
“全 上 成 汪 用 得 不 银色, 入 我 近 龙 ? 
bE “' 道 尽 涂 殖 ,到 你 了 -~ 


区 你 说 错 了 吧 , 看 吧 ,平时 多 读书 
和 没有 坏处 吧 。 


有 名 十 


18 微软 小 冰 对 话 截图 


2016 年 3 月 ,清华 大 学 语音 与 语言 实验 中 心 (CSLT) 网 站 宣布 ,他 们 开 
发 的 做 诗 机 器 人 “和 薇 薇 " 通 过 了 来 自 社 科 院 等 不 同 单位 唐诗 专家 的 评定 。 在 
“和 薇 薇 "所 创作 的 诗词 中 ,有 31% 被 专家 认定 为 人 类 创作 的 。 下 面 来 欣赏 几 
首 “ 若 薇 ” 的 作品 ,是 不 是 难以 想象 它们 竟然 出 自 一 台 冷 冰冰 的 机 器 ? 
早 和 梅 
春 信 香 深 雪 ， 
冰 肌 疲 骨 绝 。 
梅花 不 可 知 ， 
何 处 东风 约 。 
海 棠 花 
红 霞 淡 艳 媚 妆 水 ， 
万 柔 千 峰 映 碧 垂 。 
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一 夜 东风 吹 雨 过 ， 
满 城 春 色 在 天 辉 。 
镜 
照 影 金 精 映 ， 
色 头 角 徐 青 。 
自发 红袖 下 ， 
明月 满 庭 清 。 
值得 一 提 的 是 ,2017 年 5 月 ,微软 公司 和 湛 庐 文化 合作 推出 了 微软 小 冰 
原创 诗集 《阳光 失 了 玻璃 窗 》, 这 也 是 人 类 历史 上 第 一 部 100% 由 入 工 智能 创 
作 的 诗集 。 
从 小 男孩 尤 金 ,到 微软 小 冰 , 再 到 敏 客 ,看 起 来 ,现代 软 硬 件 的 进步 确实 
如 图 灵 所 预测 那样 ,有 了 天 翻 地 覆 的 改变 ,通过 图 灵 测 试 仿佛 也 是 一 件 比 较 
轻松 的 事情 。 但 是 ,通过 了 图 灵 测 试 ,就 说 明 具 有 人 工 智能 了 么 ? 这 个 问题 
同样 难以 有 确定 的 答案 ,也 许 这 仅仅 只 是 一 个 开始 。 


人 工 智 能 : 天 使 还 是 恶魔 


到 目前 为 止 , 人 们 理想 中 的 人 工 智能 ,仍然 停留 在 影视 作品 里 。 久 远 一 
点 的 有 阿诺德 . 施 瓦 辛 格 (Arnold Schwarzenegger) 主 演 的 (终结 者 》(The 
Terminator ,1984) 、 史 蒂 文 * 斯 皮尔 伯 格 (Steven Allan Spielberg) 执 导 的 (人 
工 智 能 XAI,2001), 近 一 点 的 则 有 在 第 88 届 奥 斯 卡 金 像 奖 上 斩获 “最 佳 视觉 
效果 奖 ? 的 人 《机械 姬 》CEz Machina ,2015) ,以 及 美剧 《西部 世界 》(Westworld， 
2016) 《真实 的 人 类 》(Huxaxs,2015) 等 。《 机 械 姬 》 中 的 智能 机 器 人 艾 娃 
(图 1. 9) ,其 创造 者 是 某 知 名 搜索 引擎 公司 的 老板 .智商 颇 高 的 IT 大 牛 , 而 
貌似 中 大 奖 与 亿 万 富 俩 老板 共度 周末 的 程序 员 加 利 , 既 没有 享受 到 美女 如 云 
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的 豪华 派对 ,也 没有 到 什么 度假 胜地 ,真正 的 使 命 却 是 悲 俊 地 “加 班 ”, 对 智能 
机 器 人 艾 娃 进行 图 灵 测 试 。 虽 然 , 码 农 们 更 喜欢 这 种 方式 的 超级 大 奖 ,这 比 


酒精 、 美 女 更 能 让 他 们 兴奋 。 加 利 也 确实 是 真 码 农 ,完全 没有 对 被 “ 骗 " 有 任 
何不 满 ,而 是 兴致 勃勃 地 踏 入 老板 设 下 的 局 (观众 总 是 喜欢 看 到 码 农 的 人 委 


fr 


被 如 此 安排 ) 。 值 得 注意 的 是 ,这 部 电影 里 进行 的 并 不 是 传统 意义 上 的 图 灵 


测试 ,而 是 该 测试 的 升级 版 。 


图 19 俩 械 姬 》 剧 照 


在 图 灵 大 神 最 初 设 定 的 测试 环境 里 ,被 测试 的 对 象 是 被 关 在 一 个 黑 屋 子 


里 ,测试 人 看 不 到 测试 对 象 ,只 能 根据 对 话 来 判断 对 方 的 身份 。 老 实 讲 , 在 这 
种 情况 下 ,更 多 的 只 能 判断 测试 对 象 的 表现 是 不 是 更 接近 人 类 ,说 白 了 ,就 是 
像 不 像 人 说 的 话 或 反应 。 但 要 判断 测试 对 象 是 否 具有 智能 ,就 显得 捉襟见肘 
了 。 当 然 , 以 图 灵 大 神 当时 身 处 的 时 代 , 做 到 这 一 点 已 经 难能可贵 了 。 在 《机 
械 姬 》 里 ,加 利 与 艾 娃 之 间 虽 然 隔 着 一 层 玻璃 ,但 都 可 以 看 到 对 方 , 并 且 艾 娃 
的 机 器 身体 并 未 增加 多 余 的 掩饰 。 其 实 就 对 话 而 言 , 艾 娃 要 想 通 过 图 灵 测 试 
简直 就 是 轻而易举 的 事 , 但 大 Boss 的 真正 意图 是 要 比 图 灵 测 试 更 进 一 


步 
“智能 ”的 ,甚至 达到 了 和 人们 无 法 想象 的 程度 ,否则 也 不 会 
角 迷 得 景 头 转向 。 当 然 ,影片 的 最 后 也 难免 落 入 俗套 ,人 了 
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确认 艾 娃 是 否 具有 真正 的 “智能 ”。 在 电影 的 设 定 里 , 艾 娃 是 具有 很 强 


码 农 男 主 
化 出 了 反 
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叛 意识 , 想 要 挣脱 人 类 的 极 桂 ,甚至 完成 了 反 杀 ,而 倒 考 的 男 主 则 不 幸 成 为 被 
殊 及 的 池 鱼 。 

虽然 在 影视 作品 中 高 度 发 达 的 人 工 智 能 目前 还 没有 实现 ,但 自从 图 灵 测 
试 以 后 , 随 着 计算 机 技术 和 和 人工 智能 算法 的 不 断 发 展 ,特别 在 近 几 年 ,人 工 智 
能 、 机 器 人 ,智能 家 居 等 早已 成 为 曝光 度 最 高 的 词汇 。 不 少 专家 大 胆 预测 , 互 
联网 的 下 一 波浪 潮 必 然 出 现在 人 工 智 能 领域 。 不 过 ,有 关 人 工 智能 的 争论 也 
愈演愈烈 , 力 挺 派 和 质疑 派 之 间 的 争论 从 没 停止 。 

力 挺 派 认为 人 工 智能 是 好 事 , 绝 对 是 未 来 的 发 展 方向 ,会 将 人 类 从 繁重 
单调 的 劳动 中 解放 出 来 ,会 给 入 类 社会 带 来 美好 的 未 来 ,会 使 人 类 发 展 往 前 
迈 出 一 大 步 等 等 。《 连 线 》(Wired ) 杂 志 创 始 主编 凯 文 凯利 (Kevin Kelly) 
在 其 力作 《必然 ) 中 就 表现 出 了 坚定 的 支持 :“ 未 来 的 人 工 智 能 网 络 ( 主 要 包 
含 算法 ) 将 会 成 为 “如 同 电力 一 样 无 处 不 在 、 暗 藏 不 现 的 低 水 平 持续 存在 ?。” 
近年 来 算法 的 快速 发 展 ,特别 是 神经 网 络 (Neural Networks) 算 法 在 近年 的 
高 速 发 展 , 给 了 力 挺 派 很 大 信心 ,他 们 坚定 地 认为 21 世纪 人 类 最 重大 的 发 明 
一 定 是 “真正 的 人 工 智 能 ,瑞士 人 工 智能 实验 室 的 科学 事务 主管 施 米 德 胡 贝 
(Jiirgen Schmidhuber) 是 其 中 的 代表 人 物 之 一 。 他 在 德国 慕尼黑 工业 大 学 
学 习 期 间 先 后 获得 计算 机 科学 的 学 士 和 博士 学 位 ,时 间 分 别 是 1987 年 和 
1991 年 。 从 1987 年 开始 ,他 就 是 “自我 改进 式 通用 问题 求解 算法 ?领域 的 领 
头羊 ,从 1991 年 获得 博士 学 位 后 ,又 成 为 了 深度 学 习 神 经 网 络 算法 领域 的 开 
拓 者 。 他 的 研究 团队 提出 了 一 种 名 为 递归 神经 网 络 RNN 的 技术 以 及 一 些 
相关 的 变种 ,这 些 神 经 网 络 跟 最 初 的 相 比 ,已 经 扩展 了 太 多 ,可 以 做 到 成 百 上 
干 层 , 每 一 层 都 是 无 数 神经 元 处 理 单元 的 集合 。 这 种 新 的 神经 网 络 层 数 更 
多 .功能 更 强 , 理 论 上 能 够 运行 任意 算法 ,或 实现 程序 与 环境 之 间 的 互动 。 施 
米 德 胡 贝 博士 开发 的 这 些 新 技术 革新 了 手势 识别 .机 器 翻译 .语音 识别 .图 片 
注释 等 技术 ,已 经 被 包括 谷歌 微软、 百度 、IBM 在 内 的 很 多 公司 应 用 。 有 意 
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思 的 是 ,RNN 最 初 提出 来 的 时 候 并 不 被 看 好 。1995 年 ,他 们 提出 一 种 能 够 
学 习 长 期 依赖 信息 的 RNN ,命名 为 LSTM 网 络 (Long Short Term) ,还 为 此 
专门 写 了 一 篇 论文 , 没 想 到 居然 被 著名 的 机 器 学 习 学 术 会 议 NIPS 
(Conference and Workshop on Neural Information Processing Systems ) 拒 
之 门 外 。 

施 米 德 胡 贝 博士 认为 ,以 现在 的 神经 网 络 为 基础 ,不 需要 很 多 年 ,就 可 以 
实现 跟 某 些 动物 一 样 聪 明 的 人 工 智 能 光一 旦 我 们 实现 了 动物 水 平 的 人 工 智 
能 , 几 年 或 者 几 十 年 以 后 我 们 就 可 以 拥有 人 类 水 平 的 人 工 智 能 了 , 那 是 真正 
没有 局 限 的 应 用 ,所 有 的 商业 都 会 改变 ,整个 文明 都 会 改变 ,一 切 都 会 为 之 改 
变 .” 同 时 ,他 还 认为 ,人 工 智能 并 不 会 对 人 类 生死 存亡 带 来 新 威胁 ,反而 是 核 
武器 的 威胁 更 大 一 些 。 

这 里 简单 介绍 一 下 神经 网 络 算法 。 神 经 网 络 算法 是 从 仿生 学 的 角度 出 
发 ,通过 模仿 人 类 大 脑 神经 突 触 连接 的 结构 以 及 行为 特征 ,进行 分 布 式 并 行 
信息 处 理 的 一 种 算法 模型 , 它 的 目的 是 希望 能 够 建立 类 似 人 脑 的 处 理 信 息 的 
机 制 。 通 俗 地 讲 , 人 类 的 大 脑 有 超过 100 亿 个 神经 元 ,平均 每 个 神经 元 都 和 
另外 10 000 个 神经 元 连接 在 一 起 。 这 些 神 经 元 中 有 些 是 与 接收 信息 相关 ， 
比如 听 到 声音 、 看 到 各 种 事物 、 感 受到 疼痛 、 触 碰 到 不 同 物品 的 感觉 等 ; 另 一 
些 神经 元 与 控制 相关 ,比如 控制 肌肉 做 出 各 种 动作 等 ;除了 这 两 种 , 剩 下 的 大 
多 数 神经 元 隐藏 在 这 两 者 之 间 , 目 前 对 它们 还 不 够 了 解 ,但 这 部 分 神经 元 处 
理 的 是 最 复杂 的 思考 过 程 。 所 有 的 神经 元 都 通过 改变 连接 强度 进行 学 习 , 连 
接 强度 决定 了 神经 元 之 间 彼 此 影响 力 的 大 小 。 神 经 网 络 就 是 用 计算 单元 来 
模拟 神经 元 ,并 把 这 些 计算 单元 连接 起 来 形成 网 络 。 

当然 ,质疑 派 一 直 对 此 心 存 疑虑 ,他 们 提出 了 三 个 问题 : 第 一 ,人 工 智 能 
是 否 具 有 真正 的 “理解 力 ”? 第 二 ,人 工 智 能 说 到 底 是 “人 工 ”, 错 误 不 可 避免 。 
第 三 ,人 工 智能 自我 进化 不 可 控制 。 


可 


加 
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关于 理解 力 的 问题 ,这 涉及 一 个 著名 的 思想 实验 一 一 玛丽 黑白 色彩 实 
验 。 研 究 色 彩 的 女 科 学 家 玛丽 从 一 出 生 就 被 关 在 一 间 房 子 里 ,这 个 房间 里 所 
有 的 布置 和 各 种 设施 ,包括 玛丽 穿 的 衣物 ,都 只 有 黑 与 白 两 种 颜色 ,这 里 就 是 
她 所 有 的 生活 空间 。 在 这 里 ,玛丽 获得 了 所 有 关于 色彩 的 物理 知识 (光学 知 
识 或 神经 学 知识 等 ) ,但 没有 亲眼 看 到 过 这 些 颜 色 。 直 到 有 一 天 ,玛丽 终于 获 
准 走出 房屋 ,看 到 了 真实 世界 中 的 各 种 色彩 ,比如 ,她 看 到 了 红色 的 西红柿 。 
那么 ,问题 来 了 : 玛丽 是 否 获得 了 更 多 的 知识 ? 对 于 玛丽 看 到 真实 西红柿 的 
反应 ,一般人 的 直觉 应 该 是 ,玛丽 看 到 西红柿 应 该 会 获得 某 种 直观 的 感受 ,也 
就 是 说 ,玛丽 可 能 会 惊讶 : 原来 真正 的 西红柿 (红色 ) 是 长 这 样 啊 ! 如 果 大 家 
都 承认 这 种 情况 会 出 现 , 那 是 不 是 就 说 明了 物理 知识 并 不 是 所 有 事实 的 知 
识 , 它 并 不 完备 ,因为 如 果 物 理 知识 是 完备 的 , 则 玛丽 不 会 出 现 惊讶 的 感觉 。 
简单 地 讲 ,这 个 结论 是 说 明了 知识 和 真实 感受 之 间 的 区 别 ,比如 别人 告诉 你 
挨 搁 会 痛 , 与 真正 被 搁 感 觉 到 的 痛 是 两 个 概念 。 

同样 ,具有 人 工 智能 的 机 器 或 算法 ,所 拥有 的 知识 都 是 这 类 物理 知识 , 即 
使 它 能 表现 出 类 似 人 类 的 理解 力 ,但 是 , 它 真 正 理解 吗 ? 从 机 器 嘴 里 蹦 出 来 
的 “我 认为 .我 感觉 "这 些 话 ,是 它 真正 的 想法 吗 ? 

人 工 智能 说 到 底 还 是 人 弄 出 来 的 ,人 类 本 身 就 很 难 避 免 错误 ,再 面 对 人 
工 智能 这 么 复杂 的 系统 ,能 保证 不 出 问题 吗 ? 2011 年 合众国 际 社 报道 ,美国 
加 州 大 学 的 生物 学 家 迈克 尔 . 艾 森 在 做 研究 时 ,需要 从 一 本 名 叫 ( 苍 蝇 的 成 
长 过 程 XThe Making of a FLy) 的 书 中 查找 资料 。 很 自然 地 ,他 在 亚马逊 网 
站 上 进行 搜索 ,不 料 搜索 结果 让 他 大 吃 一 惊 ,这 本 书 的 单价 居然 是 170 万 美 
元 ,“ 肯 定 是 亚马逊 弄 错 了 ,我 等 等 吧 ”, 艾 森 当 时 这 么 想 。 就 这 样 , 艾 森 每 天 
都 登录 亚马逊 ,查看 这 个 错误 定价 是 否 已 被 修改 。 然 而 , 令 艾 森 意外 的 是 ,这 
个 问题 不 但 没有 被 修正 ,反而 价格 越 来 越 高 ,在 一 周 之 内 ,居然 飙升 到 了 
2369 万 美元 一 本 。 这 是 一 本 什么 神 书 !? 后 来 ,亚马逊 终于 发 现 了 这 个 问 
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题 , 把 价格 改 回 了 正常 水 平 。 但 这 是 怎么 回 事 儿 呢 ? 原来 问题 出 在 算法 上 。 
亚马逊 的 图 书 定价 是 算法 决定 的 ,算法 会 根据 其 他 卖家 的 定价 .供求 关系 等 
因素 来 实时 调整 图 书 的 价格 。 但 当初 设计 定价 算法 的 码 农 没 有 注意 到 其 中 
缺少 一 个 价格 上 限 。 结 果 , 机 缘 巧 合 之 下 ,两 个 网 站 的 定价 算 
法 在 这 本 书 上 开始 了 死 奢 : 你 涨 一 毛 , 我 就 要 比 你 多 5 分 。 最 后 的 结果 导致 
了 天 价 图 书 的 出 现 。 质 疑 派 难免 会 感到 悲观 : 你 看 ,就 连 给 书 定价 这 么 一 个 
简单 的 智能 算法 都 会 出 现 问题 ,我们 怎么 能 够 对 人 工 智能 算法 有 信心 ? 

同时 ,质疑 派 最 大 的 担忧 还 来 自 于 人 工 智能 的 进化 是 否 能 受到 有 效 的 监 
督 和 约束 。《 连 线 》 杂 志 在 2014 年 6 月 刊 出 的 一 篇 文章 Why We Need to 
Tame Our Algorithms Like Dogs (我 们 为 什么 要 像 驯 狗 那 样 驯化 算法 ) 中 谈 
到 :“ 人 类 目前 正在 与 另外 一 种 我 们 之 外 的 物种 共生 在 一 起 ,与 犬 科 动物 相 
比 , 它 更 加 危险 也 更 有 威力 : 这 就 是 算法 。” 

这 样 的 说 法 似乎 也 不 无 道理 。2016 年 11 月 17 日 ,在 深圳 举办 的 第 十 八 
届 中 国 国际 高 新 技术 成 果 交 易 会 上 ,一 台 名 为 “小 胖 ” 的 机 器 人 在 没有 收 到 任 
何 指令 的 前 提 下 ,突然 暴打 所 在 展台 的 玻璃 墙 ,展台 破坏 严重 ,玻璃 碎片 四 处 
飞溅 ,一 名 运气 不 太 好 的 参观 者 被 玻璃 碎片 划 伤 ,最 后 被 送 上 120 急救 车 ,如 
图 1. 10 所 示 。 虽然 事后 涉 事 参展 商 负责 人 发 布 消息 说 ,机 器 人 异常 行为 是 
由 于 工作 人 员 的 误 操 作 导致 的 。 但 是 真相 如 何 , 众 说 纷 绒 。2017 年 6 月 ， 
《大 西洋 月 刊 ) 网 站 也 报道 了 一 则 机 器 人 不 受 控 的 例子 : Facebook 在 实际 中 
让 两 个 AI 聊天 机 器 人 对 话 ,发 现 机 器 人 竟 逐 渐 发 展 出 人 类 无 法 理解 的 独特 
语言 ,研究 人 员 不 得 不 对 其 进行 人 工 干预 。AI 自行 升级 的 速度 超出 预期 ,让 
人 不 禁 担心 ( 银 翼 杀手 ) 中 的 恐怖 场景 会 在 现实 生活 中 出 现 。 

为 了 确保 人 类 自身 的 安全 ,20 世纪 最 伟大 科幻 作家 之 一 的 伊 萨 克 … 阿 
西 莫 夫 于 1942 年 在 其 短篇 作品 Runaround 中 ,首次 提出 了 机 器 人 三 大 法 
则 , 即 
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(1) 机 器 人 不 得 伤害 人 类 ,或 因 不 作为 使 人 类 受到 伤害 ; 

(2) 除非 违背 第 (1) 法 则 ,机 器 人 必须 服从 人 类 的 命令 ; 

(3) 在 不 违背 第 (2) 法 则 的 情况 下 ,机 器 人 必须 保护 自己 。 

后 来 , 阿 西 莫 夫 还 加 入 了 一 条 第 (0) 条 法 则 , 即 

(0) 机 器 人 不 得 伤害 人 类 整体 ,或 因 不 作为 使 人 类 整体 受到 伤害 。 


图 110 涉 事 机 器 人 小 胖 ”" 和 事故 现场 


阿 西 莫 夫 规定 ,这 几 条 法 则 都 必须 植 入 机 器 人 智能 算法 的 底层 ,所 有 机 
器 人 都 必须 遵守 。 但 是 , 别 的 不 说 ,单单 这 几 条 法 则 ,本 身 就 存在 漏洞 .缺陷 
和 模糊 之 处 ,比如 人 ”的 定义 “机 器 人 ”的 定义 ,都 还 在 争论 之 中 ,没有 形成 
定论 。 这 些 模糊 或 不 完整 的 信息 ,完全 有 可 能 导致 人 工 智能 的 行为 不 可 控 ， 
打破 这 些 所 谓 的 “ 铁 律 "”。 艾 娃 的 算法 里 是 写 入 了 不 能 伤害 人 类 的 指令 ,但 艾 
娃 在 自主 进化 过 程 中 不 但 进化 出 控制 电力 的 能 力 , 也 完全 摆脱 了 不 能 伤害 人 
类 的 极 覆 ,所 谓 的 铁 律 在 进化 的 力量 面前 不 堪 一 击 。 美 国 斯 坦 福 大 学 的 生物 
学 家 合 博 拉 ， 戈 登 (Deborah Gordon) 在 接受 (量子 杂志 ) 的 采访 时 曾 谈 到 : 
“进化 可 能 会 在 不 同系 统 中 创造 出 用 来 解决 相同 问题 的 不 同 算法 ”这 充分 说 
明了 进化 过 程 和 结果 的 不 可 控 。 例 如 ,制造 出 100 个 一 模 一 样 的 艾 娃 ,经 过 
相同 的 进化 历程 ,可 能 有 些 艾 娃 会 遵守 指令 老 老 实 实 待 在 小 黑 屋 ;有 些 可 能 
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会 请 求 大 Boss 带 她 出 去 看 看 外 面 的 风景 ;而 有 些 可 能 会 像 影片 中 那样 ,进化 
出 暴力 的 解决 方案 。 

再 回想 一 下 前 面 提 到 的 让 人 工 智能 自动 纠 错 、 进 化 的 神经 网 络 算法 , 超 
大 的 规模 已 经 远 远 超过 人 所 能 控制 的 范围 ,有 谁 能 保证 这 其 中 不 是 危机 四 
伏 ? 有 可 能 一 次 进化 的 微小 错误 ,就 会 导致 人 类 巨大 的 灾难 ,就 像 那 只 南美 
洲 亚马逊 河流 域 热带 雨林 中 的 蝴蝶 ,只 不 过 轻 轻 扇 动 一 下 翅膀 ,两 周 后 就 会 
引起 美国 得 克 萨 斯 州 的 一 场 龙卷风 。 

加 拿 大 学 者 马 葡 尔 . 麦克 卢 汉 (Marshall McLuhan) 在 其 著作 《理解 媒 
介 ) 中 写 道 : “起初, 我 们 塑造 了 工具 ,最 后 工具 又 反 过 来 塑造 我 们 .” 现 在 ,我 
们 正 走 在 塑造 入 工 智 能 的 路 上 ,未 来 ,人 工 智 能 会 怎样 反 塑 人 类 ,是 用 一 种 温 
和 渐进 的 方式 ,还 是 激烈 突变 的 方式 ? 谁 也 不 知道 。 


算法 的 复杂 性 


复杂 性 杀 死 一 切 。 它 把 程序 员 的 生活 给 摘 砸 了 , 它 令 产品 难以 规划 、 创 
建 和 测试 , 带 来 了 安全 挑战 ,并 导致 最 终 用 户 和 管理 员 肖 表 不 已 。 
一 一 雷 。 奥 益 Microsoft 


耗 时 又 耗 力 的 算法 


有 些 算 法 很 简单 ,但 更 多 的 是 复杂 的 算法 。 高 斯 小 时 候 计 算 等 差 数 列 的 
算法 ,大 概 需 要 四 分 之 一 张 A4 纸 , 一 支 铅笔 ,在 5 分 钟 之 内 就 可 以 得 到 结 
果 。 较 复杂 的 算法 ,可 以 回想 一 下 我 们 在 前 面 介绍 过 的 ,图 灵 为 了 破解 德军 
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的 英 格 玛 密码 机 ,制造 了 一 台 名 叫 * 图 灵 甜 点 ”的 机 器 来 对 抗 。“ 图 灵 甜 点 ”在 
进行 暴力 破解 时 ,如 果 遇 到 可 能 的 解 , 它 就 会 停 下 来 ,以 便 工 作 人 员 进 行 记 
录 ; 而 它 没有 停 下 来 的 时 候 , 人 们 就 只 能 站 在 旁边 等 待 。 这 个 时 间 可 长 可 短 ， 
短 的 话 可 能 几 十 分 钟 ,长 的 话 可 能 得 好 几 个 小 时 。 这 是 图 灵 破 解 算法 的 一 个 
大 概 的 执行 时 间 长 度 。 

更 复杂 一 些 的 问题 呢 ? 

有 一 个 名 叫 *3z 十 1 的 猜想 , 它 的 内 容 很 有 趣 :“ 任 取 一 个 自然 数 ,如 果 : 
(a) 它 是 偶数 的 话 , 就 把 它 除 以 2; (b) 如 果 它 是 奇数 的 话 ,就 把 它 乘 上 3 再 
加 1; 这样 我 们 就 得 到 一 个 新 的 自然 数 ,对 这 个 新 的 自然 数 再 继续 重复 这 两 
步 变 换 , 会 得 到 一 串 自然 数 ,最 后 一 个 自然 数 一 定 是 1。” 

我 们 用 自然 数 4 来 试 一 下 。4 是 偶数 ,把 它 除 以 2 ,我们 得 到 2;2 仍然 是 
偶数 ,再 把 它 除 以 2, 确 实 得 到 的 是 1。 我 们 再 找 个 大 点 的 数 ,比如 7。7 是 奇 
数 ,把 它 乘 以 3 再 加 1, 得 到 22;22 是 偶数 ,把 它 除 以 2 得 到 11;11 是 奇 
数 ，……: ,最 后 我 们 得 到 的 一 串 数 是 7 一 22 一 11-34 一 17 一 52 一 26 一 13 一 
40 一 20 一 10 一 5 一 16 一 8 一 4 一 2 一 1。 经 过 16 步 变换 ,我 们 最 后 真 的 得 到 了 1 。 
如 果 你 有 足够 的 时 间 和 兴趣 ,还 可 以 尝试 一 些 更 大 的 数 , 试 一 试看 最 后 是 不 
是 都 回 到 1 。 

其 实 , 这 个 猜想 在 西方 经 常 被 称 为 西 拉 古 斯 (Syracuse) 猜想 ,因为 据说 
这 个 问题 是 20 世纪 50 年 代 在 美国 西 拉 古 斯 大 学 (Syracuse University, 也 译 
为 雪 城 大 学 ) 提 出 来 并 开始 研究 的 。 耶 鲁 大 学 教授 .日 本 数学 家 角 谷 静 夫 将 
这 个 问题 带 到 日 本 ,因此 在 东方 ,这 个 问题 也 称 为 角 谷 猜想 。 此 外 , 它 还 有 一 
大 堆 各 式 各 样 的 名 字 , 大 都 与 研究 它 的 数学 家 有 关 , 上 比如 克拉 北 (Lothar 
Collatz, 德 国 数学 家 ) 问 题 .乌拉 姆 问题 CStanislaw Ulam, 波 兰 毅 美国 数学 家 ) 
等 等 。 后 来 ,大 家 为 了 方便 ,就 把 它 简称 为 “3z 十 1 猜想 。 

据 角 谷 教授 介绍 ,当时 有 整整 一 个 月 的 时 间 , 整 个 耶鲁 大 学 的 人 都 在 试 
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图 解决 这 个 问题 ,但 是 不 幸 的 是 ,没有 取得 任何 结果 。 后 来 在 芝加哥 大 学 也 
上 演 了 同样 的 场景 ,同样 是 无 疾 而 终 。 这 个 问题 让 人 如 此 疯狂 ,以 至 于 有 人 
甚至 猜测 ,这 个 问题 是 苏联 克格勃 的 阴谋 ,真正 的 目的 是 要 阻碍 美国 数学 的 
发 展 。 这 样 的 猜测 令 角 谷 教授 也 忍俊不禁 ,他 对 克格勃 是 否 有 如 此 远大 的 数 
学 眼光 表示 怀疑 ,不 过 他 也 表示 ,对 于 这 种 形式 如 此 简单 ,解决 起 来 却 如 此 困 
难 的 问题 ,实在 是 可 遇 不 可 求 , 拥 有 非凡 的 魅力 。 

现在 我 们 用 图 灵机 来 尝试 一 下 是 否 能 够 解决 这 个 问题 。 假 设 我 们 现在 
有 一 台 制 造 出 来 的 图 灵机 ,有 无 限 长 的 纸 带 ,我 们 将 “3z 十 1 猜想 写成 一 个 简 
单 的 算法 程序 , 存 到 图 灵机 里 ,让 它 帮 我 们 做 一 件 事情 : 找 出 一 个 不 满足 猜 
想 的 数 并 输出 到 纸 带 上 。 于 是 ,算法 开始 指挥 图 灵机 的 读 写 头 移 到 纸 带 的 第 
一 格 , 读 入 第 一 个 数 1, 检 验 是 不 是 符合 要 求 ,然后 读 入 第 二 个 数 ,根据 规则 
进行 判断 ,然后 做 相应 的 操作 ,并 将 中 间 过 程 所 得 到 的 数 记录 在 纸 带 上 。 读 
写 头 就 这 样 不 断 移 来 移 去 ,很 长 时 间 都 不 会 停 下 来 ,如 果 安 排 一 个 20 岁 的 年 
轻 学 生 每 天 来 查看 一 下 是 否 找到 了 不 满足 规则 的 数 , 也 就 是 读 写 头 是 否 会 停 
下 来 ,以 读 写 头 的 速度 ,估计 等 他 到 了 老 孝 之 年 ,都 不 会 停 下 来 。 

然而 ,得 益 于 现代 计算 机 技术 的 发 展 ,计算 速度 有 了 飞速 提高 ,使 得 我 们 
在 较 短 的 时 间 内 就 可 以 算 到 很 大 的 数 。 目 前 ,据说 有 人 已 验证 过 的 最 大 的 数 
是 2”X100 二 112 589 990 684 262 400, 从 1 到 这 个 巨大 的 数 , 通 过 变换 最 后 
都 会 回归 到 1 ,无 一 例外 。 图 1. 11 展示 了 验算 从 1 一 9999 的 每 个 数 需要 花费 
的 时 间 。 

验算 这 个 猜想 的 时 候 , 除 了 那个 不 知 疲倦 、. 勤 勤恳 恳 来回 奔波 的 读 写 头 ， 
另外 一 个 需要 注意 的 就 是 那 条 长 长 的 纸 带 。 在 这 条 纸 带 上 ,记录 着 所 有 被 验 
算 的 数 ,以 及 在 验算 过 程 产生 的 中 间 结 果 , 也 就 是 说 , 像 上 面 验算 “7” 的 例子 
一 样 , 每 个 数 后 面 都 跟着 一 串 数字 序列 。 我 们 无 法 想象 这 条 纸 带 究竟 会 有 多 
长 ,也 许 从 地 球 到 月 球 ( 约 38.4 万 公里 ) 这 么 长 的 距离 也 是 不 够 的 吧 。 
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Rd 
1000 3000 5000 7000 9000 


111 验证 sz 十 人 猜想 的 时 间 开销 图 


度量 算法 的 两 大 基准 


通过 上 面 的 例子 ,大 家 也 许 已 经 发 现 , 与 算法 性 能 有 密切 相关 的 是 两 个 
方面 ,一 是 多 和 久 可 以 得 到 最 终 的 结果 ,也 就 是 上 面 所 讲 的 读 写 头 多 久 能 停 下 
来 ,给 出 一 个 不 能 变换 到 1 的 自然 数 ;二 是 需要 多 大 容量 来 支持 ,也 就 是 上 面 
所 讲 的 纸 带 有 多 长 , 纸 带 越 长 ,能 容纳 的 结果 越 多 。 的 确 ,从 时 间 和 空间 这 两 
个 维度 上 可 以 衡量 算法 的 优 劣 程度 。 事实 上 ,现在 人 们 也 正 是 这 么 做 的 , 评 
估 方 法 的 正式 名 称 , 称 为 时 间 复 杂 度 和 空间 复杂 度 。 

从 字面 上 看 ,时 间 复 杂 度 和 空间 复杂 度 并 不 难 理解 。 时 间 复 杂 度 用 来 衡 
量 算法 执行 所 花费 的 时 间 , 是 表达 时 间 变 化 规律 的 概念 。 算 法 是 由 计算 机 语 
名 (程序 ) 来 描述 的 ,因此 一 个 算法 执行 所 花费 的 时 间 与 需要 执行 的 程序 的 语 
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和 句 多少 成 正比 ,需要 执行 的 语句 越 多 ,算法 就 越 耗 时 。 人 们 给 算法 中 语句 的 
执行 次 数 起 了 一 个 名 字 , 称 为 时 间 频 度 ,用 符号 T(n) 来 表示 。 时 间 频 度 中 的 
nn 称 为 问题 的 规模 ,显然 ,n 越 大 ,时 间 频 度 越 大 。 一 般 来 说 ,算法 中 语句 的 执 
行 次 数 是 nn 的 函数 ,也 就 是 时 间 频 度 ,如 果 存 在 菜 个 函数 f(n) ,使 得 在 n 趋 
近 于 无 穷 大 的 时 候 ,T(n) 与 /(n) 比 值 的 极限 是 不 为 零 的 常数 ,就 称 1(n) 是 
T(n) 的 同 量 级 函数 。 时 间 复 杂 度 用 大 写 的 英文 字母 〇 表示 ,也 就 是 T(n) 王 
OC(f(m))。 一 般 情况 下 ,标记 时 间 复 杂 度 时 ,只 取 f(n) 的 最 高 次 项 ,也 就 是 运 
算 次 数 受 影响 最 大 的 那 一 项 ,不 包括 该 项 的 系数 和 低 阶 项 。 比 如 ,对 于 
TO 一 姑 十 72 和 T(n) 二 522? 十 3n 十 5, 它 们 的 时 间 频 度 不 同 , 但 时 间 复 杂 度 都 
是 O(n?)。 

相似 地 ,空间 复杂 度 定义 为 运行 完 算法 (程序 ) 需 要 的 存储 空间 的 大 小 ， 
包括 不 变 空间 和 可 变 空 间 两 部 分 , 它 也 是 规模 nn 的 函数 ,同样 用 〇 来 表示 。 

下 面 ,我 们 以 一 个 计算 最 短路 径 的 算法 为 例 ,看 看 时 间 复 杂 度 和 空间 复 
杂 度 是 怎么 得 到 的 。 计 算 机 科学 里 有 一 个 著名 的 Dijkstra 算法 ,中 文 发 音 称 
为 迪 杰 斯 特 拉 算法 。 这 个 算法 是 用 它 的 发 明 人 艾 兹 赫 尔 ' 韦伯 … 迪 杰 斯 特 
拉 (Edsger Wybe Dijkstra) 的 名 字 命 名 。 迪 杰 斯 特 拉 来 自 荷 兰 ,他 的 贡献 非 
常 多 ,覆盖 了 很 多 领域 ,是 计算 机 科学 的 黄 基 人 之 一 。 

迪 杰 斯 特 拉 算 法 是 经 典 的 单 源 最 短路 径 算 法 ,也 就 是 说 ,计算 从 一 个 节 
点 出 发 ,到 其 他 所 有 节点 的 最 短路 径 。 迪 杰 斯 特 拉 算法 在 生活 中 的 应 用 场景 
很 多 ,比如 网 络 路 由 查找 、 城 市 规划 ,地质 勘探 ,车 辆 导航 、 物 流 配送 等 。 以 下 
是 这 个 算法 的 基本 思想 。 

考虑 一 个 路 径 搜索 的 例子 ,以 图 1. 12 为 基础 ,计算 从 清华 大 学 出 发 ,分 
别 到 达 鸟 集 、 国 家 图 书馆 .鼓楼 ,北京 西 站 和 东直门 的 最 短路 径 。 如 果 某 两 个 
地 点 之 间 有 直接 相连 的 边 ,说 明 这 两 个 地 点 直接 可 达 , 这 条 边 上 的 数字 表示 
经 过 这 条 边 所 需要 花费 的 代价 ,可 以 是 时 间 、 金 钱 等 。 如 果 某 两 个 地 点 之 间 
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没有 直接 相连 的 边 ,就 表示 这 两 个 地 点 不 能 直达 ,必须 要 通过 别 的 地 点 ,比如 
清华 大 学 到 鼓楼 不 能 直达 ,代价 为 无 穷 大 ,只 能 通过 鸟巢 或 国家 图 书馆 过 去 。 
下 面 开 始 计算 : 

(1) 选 定 清华 大 学 为 起 点 , 则 此 时 地 点 集合 V 二 {清华 大 学 } ,路 径 集合 
= 
(2) 从 清华 大 学 出 发 ,开始 搜索 ,发 现 可 以 到 达 鸟 巢 和 国家 图 书馆 ,代价 
分 别 是 6 和 3, 因 为 3 小 于 6, 所 以 选 定 代价 为 3 的 这 条 边 , 将 新 的 地 点 和 边 
加 入 地 点 集合 和 边 集 合 , 此 时 Y= (清华 大 学 ,国家 图 书馆 六 路 径 集合 E= 
{清华 大 学 一 国家 图 书馆 二 3}。 

(3) 从 国家 图 书馆 这 个 顶点 开始 搜索 ,可 以 发 现 从 清华 大 学 经 过 国家 图 
书馆 到 达 鸟 巢 .鼓楼 和 北京 西 站 的 代价 分 别 是 5.6、7( 注 意 从 清华 大 学 直接 
到 鸟巢 的 代价 是 6, 大 于 5) ,因此 选取 代价 为 5 的 边 , 此 时 V={ 清 华 大 学 , 国 
家 图 书馆 ,鸟巢 } ,路 径 集合 下 = (清华 大 学 一 国家 图 书馆 =3 ,清华 大 学 一 国 
家 图 书馆 一 鸟巢 =5)。 

(4) 类 似 地 ,从 鸟巢 开始 搜索 ,得 到 的 V= {清华 大 学 ,国家 图 书馆 , 鸟 
梨 , 喜 楼 } ,路 径 集 合 E=={ 清 华 大 学 一 国家 图 书馆 ==3, 清 华 大 学 一 国家 图 书 
馆 一 鸟巢 =5, 清 华 大 学 一 国家 图 书馆 一 鼓楼 一 6} 。 

(5) 以 此 类 推 , 最 后 得 到 V={ 清 华 大 学 ,国家 图 书馆 , 鸟 梨 ,鼓楼 ,北京 
西 站 ,东直门 ,路 径 集合 已 = {清华 大 学 一 国家 图 书馆 =3, 清 华 大 学 一 国家 
图 书馆 一 鸟巢 一 5, 清 华 大 学 一 国家 图 书馆 一 鼓楼 二 6, 清华 大 学 一 国家 图 书 
馆 一 北京 西 站 一 7 ,清华 大 学 一 国家 图 书馆 一 鼓楼 一 东直门 一 9}。 

此 时 ,所 有 的 地 点 都 加 入 了 地 点 集合 ,算法 结束 ,从 清华 大 学 出 发 分 别 到 
达 5 个 目的 地 的 最 短路 径 就 这 样 出 现 了 ,如 图 1. 12 右 图 中 实 线路 径 所 示 。 
从 上 面 的 过 程 可 以 看 出 , 迪 杰 斯 特 拉 算 法 是 一 种 按 路 径 长 度 递增 的 次 序 来 找 
出 最 短路 径 的 算法 。 
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4 北京 人 
国家 图 书馆 。 北京 西 站 家 图 书馆 “北京 西 站 


112 迪 杰 斯 特 拉 算 法 搜索 最 短路 径 示 意图 


我 们 再 用 迪 杰 斯 特 拉 算 法 来 看 看 什么 是 时 间 复 杂 度 。 假 定 使 用 邻接 矩 
阵 来 存储 路 径 图 ,从 算法 步 又 可 以 看 到 ,每 从 一 个 地 点 出 发 开始 搜索 ,都 需要 
扫描 剩 下 的 所 有 地 点 。 如 果 图 中 的 节点 数 是 n, 则 需要 搜索 的 总 次 数 是 nX 
(n 一 1)。 根 据 前 面 介绍 的 时 间 复 杂 度 的 概念 ,可 以 得 到 迪 杰 斯 特 拉 算 法 的 时 
间 复 杂 度 为 O02 )。 从 效率 上 讲 , 随 着 规模 增 大 ,算法 效率 会 比较 低 , 因 此 
后 来 陆续 出 现 了 很 多 优化 的 迪 杰 斯 特 拉 算 法 ,效率 有 明显 提升 。 类 似 地 ,如 
果 采 用 邻接 矩阵 的 方式 存储 ,存储 的 结构 是 一 个 nXn 和 矩阵 ,因此 空间 复杂 度 
也 是 O(w?)。 采 用 其 他 存储 结构 的 情况 ,读者 可 以 自行 分 析 。 

算法 是 一 个 很 大 的 概念 ,内 涵 非 常 丰富 。 狭 义 的 算法 一 般 指 具体 的 数学 
计算 方法 ,比如 加 \ 减 .乘除 ,或 是 编写 计算 机 程序 中 使 用 到 的 编程 方法 和 技 
巧 。 广 义 的 算法 是 指 解 决 问题 的 具体 方法 和 步骤 ,比如 曹 冲 称 象 的 方法 。 正 
如 前 文 提 到 的 ,如 果 没 有 专门 说 明 , 本 书 中 谈 到 的 算法 都 是 指 广义 算法 。 图 
灵 奖 得 主 巴 特 勒 * 兰 普 森 (Butler Lampson) 说 “一 切 皆 可 计算 ”, 通 过 数学 建 
模 的 方式 ,物理 现象 和 规律 可 以 被 计算 和 理解 ,有 了 互联 网 ,人 类 社会 也 可 以 
被 计算 ,从 21 世纪 开始 ,智能 活动 也 可 以 被 计算 。 当 然 ,计算 的 前 提 是 算法 ， 
算法 是 计算 开始 的 基础 。 在 解决 复杂 的 社会 经 济 问题 时 ,必须 从 间 题 中 抽象 
出 可 解 的 数学 模型 ,围绕 这 个 模型 来 设计 算法 ,最 后 交 给 计算 机 进行 计算 ,并 
根据 计算 结果 修正 模型 和 算法 。 在 这 个 过 程 中 ,计算 过 程 是 由 计算 机 负责 ， 
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更 复杂 的 建 模 和 算法 设计 , 则 是 由 人 来 完成 。 这 个 过 程 也 体现 了 人 类 社会 与 
算法 之 间 的 塑造 与 反 塑 关系 。 
正 是 因为 智能 经 济 的 复杂 和 快速 演进 ,人 类 从 未 像 今天 这 样 , 如 此 渴望 
能 够 有 效 把 握 事 物 的 未 来 发 展 趋势 。 幸 亏 当前 的 计算 力 发 展 日 新 月 异 , 让 算 
法 的 力量 得 以 充分 释放 ,并 逐渐 成 为 社会 经 济 生产 发 展 的 主要 推动 力 。 

算法 的 基本 介绍 就 到 这 里 ,下 面 我 们 就 要 依次 揭 开 智能 经 济 背 后 算法 的 
奥秘 ,准备 好 了 吗 ? 
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你 一 定 听 过 三 个 和 尚 
和 尚 没 水 喝 。 这 个 家 喻 户 


的 故事 : 一 个 和 尚 挑 水 喝 , 两 个 和 尚 抬 水 喝 , 三 个 
晓 的 故事 ,告诉 我 们 合作 的 重要 性 。 但 是 为 什么 两 


个 和 尚 可 以 合作 ,三 个 和 尚 却 不 能 合作 了 呢 ? 其 实 不 管 两 个 和 尚 还 是 三 个 和 
尚 ,对 他 们 来 说 占 优 策 略 0 都 是 自己 不 挑 水 ,等 着 别人 挑 水 给 自己 喝 。 在 一 
个 共享 的 利益 集体 中 ,如 果 获 得 利益 总 是 均等 的 ,那么 大 多 数 人 都 会 选择 以 


最 少 的 付出 获得 最 大 的 回 


报 。 根 据 经 济 学 家 亚当 ' 斯 密 “ 看 不 见 的 手 ” 理 论 ， 


在 市 场 经 济 中 ,每 一 个 人 都 从 利 已 的 目的 出 发 ,最 终 全 社会 却 可 以 达到 利他 
的 效果 。 但 是 我 们 却 从 三 个 和 尚 的 例子 中 ,看 到 了 "看 不 见 的 手 ? 理 论 的 悖 
论 , 即 每 个 人 从 利己 的 目的 出 发 ,最 后 的 结果 损人 不 利 已 ,也 就 是 说 我 们 得 到 
了 集体 的 最 差 解 ,而 这 个 集体 的 最 差 解 反而 是 最 稳定 的 。 为 什么 会 这 样 呢 ? 


要 知道 ,在 这 个 社会 9 


有 ,我们 每 个 人 都 不 会 是 理性 的 经 济 人 ,有 很 多 因素 


Q@ 占 优 策略 是 一 个 博弈 论 中 的 常用 术语 ,这 里 可 以 理解 为 在 一 个 多 人 竞争 或 者 合作 的 


场景 中 ,对 个 人 最 有 利 的 应 对 方 


案 。 
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会 左右 我 们 的 行为 ,比如 信息 不 对 等 .情感 因素 等 。 虽然 我 们 明白 合作 的 重 
要 性 ,但 是 在 实际 生活 中 却 不 容易 践 行 这 个 原则 。 所 以 这 个 世界 每 天 都 在 发 
生 三 个 和 尚 这 样 的 分 配 问题 ,比如 《 塔 木 德 》 中 ”富翁 的 三 妾 争 产 ” 的 故事 , 英 
法 修建 海底 隧道 工程 的 争端 ,修建 机 场 跑道 的 成 本 该 如 何 让 各 个 航空 公司 分 
摊 , 或 者 无 线 频 谱 该 如 何 分 配 等 。 虽然 共 享 经 济 正 在 如 火 如 茶 地 发 展 ,然而 
不 同 利益 主体 之 间 的 利益 分 配 并 不 是 一 件 简单 的 事情 。 面 对 未 来 的 新 型 商 
业 市 场 ,共享 经 济 的 合作 机 制 将 何去何从 ,算法 又 能 在 其 中 发 挥 怎样 的 作 


3 呢 ? 


公平 分 配 从 来 就 是 一 道 难 题 


财产 是 一 切 罪恶 的 根源 ; 财产 的 分 配 与 保卫 占据 了 整个 世界 。 
一 一 列 夫 。 托 尔 斯 秦 
人 类 是 集体 动物 ,人 类 的 社会 经 济 活动 也 是 一 种 合作 活动 。 小 到 一 个 家 
庭 ,大 到 一 个 社会 , 想 要 彼此 协作 创造 出 最 大 价值 ,首先 要 解决 分 配 问题 。 然 
而 ,从 古 至 今 ,分 配 都 是 一 个 不 好 解决 的 难题 。 


富翁 的 三 奉 争 产 


对 于 有 着 “世界 第 一 商人 ”之 称 的 犹太 人 来 说 ,《 塔 木 德 ) 是 他 们 终身 都 在 
研读 的 一 本 书 , 堪 称 犹 太 人 的 圣经》 图 2. 1) 。 它 凝结 了 上 千年 来 2000 多 名 
犹太 学 者 对 自己 民族 的 历史 文化 和 智慧 的 发 掘 ,思考 和 总 结 ,是 整个 犹太 民 
族 生 活 方式 的 航 图 和 精神 支柱 。 里 面 不 仅 记 载 了 犹太 人 的 处 世 哲 学 ,也 讲 了 


41 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


不 少 理财 智慧 ,其 中 有 一 个 著名 的 财产 分 配 的 故 


事 一 三 妆 争 


名 富 公 陆续 机 了 三 房 年 轻 漂亮 的 帮 
着 安逸 幸福 的 生活 。 没 想到 年 近 古 稀 , 大 病 一 
场 ,他 这 才 开 始 为 遗产 的 事 焦虑 。 为 了 避免 三 个 
太太 不 必要 的 争端 ,这 名 富翁 在 遗书 中 对 自己 的 


财产 进行 了 分 配 ,他 


向 这 三 位 妻子 许诺 , 待 


他 死 后 将 分 给 大 老婆 100 块 金币 ,二 老婆 200 块 
金币 ,小 老婆 300 块 金币 。 三 位 太太 对 此 也 都 欣 


然 同意 。 


一 年 后 ,富翁 病逝 ,然而 在 清算 


让 歼 


图 21 伐木 德 》 


财产 的 时 候 , 大 家 才 发 现 这 个 富翁 名 不 副 


实 , 留 下 来 的 钱 根本 不 足 600 块 金币 ! 但 是 三 房 太太 都 想得到 承诺 的 金币 数 


时 , 便 请 来 了 拉 比 ”。 拉 比 是 一 些 精通 律 法 的 文士 ,他 们 会 担任 民事 法 庭 的 


法 官 ,进行 民事 案件 的 裁决 。 众 拉 比 经 过 讨论 ,给 出 了 如 表 2. 1 所 示 的 奇怪 


的 财产 分 配方 法 。 


表 2.1 拉 比 们 的 遗产 裁决 
总 金币 数量 房 全 房 EE 房 
100 块 100/3 100/3 100/3 
200 块 50 75 75 
300 块 50 100 150 
按 通 常 逻辑 ,这 三 人 得 到 的 遗产 比例 应 为 1 : 2 : 3, 而 在 犹太 先哲 们 的 


裁决 中 ,只 
是 为 什么 ， 


:遗产 数 为 300 的 情况 下 这 一 比例 才 成 立 。 
这 个 奇怪 的 方案 也 就 成 了 干 十 之 谜 。 


没有 人 可 以 解释 这 
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英法 海底 隧道 工程 


英法 海底 隧道 仅 次 于 日 本 青 函 隧道 ,是 世界 第 二 大 海底 隧道 ,总 长 50 干 
米 ,其 中 海底 部 分 39 干 米 ,如 图 2. 2 所 示 。 


22 英法 海底 隧道 


这 条 巨型 隧道 的 修建 并 非 简单 之 事 , 由 于 成 本 开销 和 预算 太 大 ,前 后 经 
历 了 多 次 尝试 与 失败 。 

第 一 次 尝试 : 1802 年 ,法 国 采矿 工程 师 马 蒂 厄 (Abel Mathieu) 第 一 次 提 
出 要 在 英法 之 间 修 建 海底 隧道 的 这 一 大 胆 设想 ,标榜 “2 小 时 马车 就 能 互通 
英法 ”DP。 当 时 任 法 兰 西 第 一 共和 国 第 一 执政 的 正 是 极 具 军事 野心 的 拿 破 
仑 ,这 个 令 人 激动 的 隧道 计划 立刻 引起 了 他 极 大 的 兴趣 ,当场 拍板 说 要 支持 
修建 。 

第 一 次 失败 (军事 问题 ): 1803 年 5 月 16 日 ,由 于 英法 两 国 战火 不 断 ,一 
场 特 拉 法 尔 加 战役 把 拿破仑 的 侵 英 梦想 几乎 完全 击 碎 。 这 场 海战 的 爆发 使 
拿破仑 不 得 不 放弃 了 海底 隧道 的 计划 。 


@@ 61 年 后 (1863 年 ) ,世界 上 才 有 了 第 一 条 地 铁 , 即 英国 伦敦 的 大 都 会 地 铁 , 其 干线 长 度 
约 6.5 km, 采 用 蒸汽 机 车 牵引 。 
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Gamond) ,开始 对 连接 海峡 两 端的 想法 产生 兴趣 ,他 耗 尽 毕生 的 心血 ， 
一 个 海底 构筑 带 的 方案 ,得 到 了 当时 路 易 王 子 的 大 力 支持 。 


第 二 次 尝试 : 1834 年 ,一 个 年 仅 27 岁 的 年 轻 人 ,加 蒙 (AimeThome de 


设计 了 


第 二 次 失败 (政治 问题 ): 然而 某 天 ,拿破仑 三 世 的 马车 在 去 往 巴 黎 歌 剧 


院 的 路 上 被 炸弹 袭击 ,经 过 仔细 分 析 ,得 知 炸弹 的 制作 地 为 英国 伯明翰 , 便 再 
次 搁置 了 海底 隘 道 的 推进 。 因 为 相 比 于 一 个 建筑 工程 ,毕竟 还 是 头 上 


要 重要 得 多 了 。 


的 皇冠 


第 三 次 尝试 : 从 1872 年 开始 ,经 过 三 年 官僚 主义 斗争 和 外 交手 段 的 运 


| 上 


别 开 挖 ,海底 地 质 勘 测 等 工作 同时 进行 。 


第 三 次 失败 (地 理 问 题 ): 然而 ,施工 中 却 遇 到 了 一 个 环 手 问题 ,1882 年 ， 


,方案 终于 在 1875 年 8 月 2 日 得 到 英法 两 国 议会 的 批准 2。 两 国 在 1876 
F 签 订 协议 书 ,决定 于 20 年 期 限 内 共同 修筑 海底 隧道 。 于 是 ,隧道 从 两 头 分 


上 


鉴于 莎士比亚 峭壁 (位 于 英国 多 佛 市 ,是 海底 隧道 的 英国 端 起 点 ) 的 战略 地 
位 ,英国 公众 不 愿 修筑 英法 海底 隧道 ,泰晤士 周刊 也 跟着 煽动 民众 与 论 ,使 工 
程 变 得 “妖魔 化 ”的 同时 ,“ 为 了 可 敬 的 女皇 和 可 爱 的 国民 ”, 也 为 了 不 破坏 “ 英 
国 原 有 天 然 屏 障 ”, 这 项 工程 在 1882 年 7 月 再 次 被 迫 停止 ,草草 收场 @。 


第 四 次 尝试 : 到 了 1955 年 ,英国 政府 宣布 ,海底 隧道 对 国防 安全 


再 次 进行 地 质 勘 探 ,并 确定 出 一 条 隧道 联络 线 。1966 年 6 月 8 日 ,两 
联合 公报 ,第 二 次 海底 隧道 建设 正式 开始 。 


的 影响 


已 不 复 存 在 。1957 年 ,英法 两 国共 同 成 立 了 英法 海峡 工程 公司 ,并 于 1960 
年 出 具 了 详细 报告 ,指出 修建 隧道 的 必要 性 。1964 一 1965 年 ,有 关 研 究 小 组 


国 签署 


Q@ 英法 海底 隧道 工程 : 历史 过 程 和 成 功 经 验 , 李 炎 ,车 焕 森 , 工程 研究 一 一 跨 学 科 视 时 


中 的 工程 ,2009(3) : 90-96. 
@ 刘 洪 滨 . 欧洲 海底 隧道 工程 . 海洋 开发 与 管理 , 1990(1): 77-79. 
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第 四 次 失败 (成 本 问题 ) : 由 于 实际 施工 过 程 中 的 造价 大 大 超出 了 预算 ， 
工程 遭遇 到 巨大 的 财政 障碍 。 英 法 两 国 分 别 认为 隧道 为 对 方 带 来 的 好 处 更 
多 ,因此 对 方 应 该 承担 更 多 的 成 本 ,如 此 僵持 , 互 不 相让 。 于 是 在 开 挖 15 个 
月 之 后 的 1975 年 , 面 对 无 法 解决 的 财政 问题 ,终于 有 人 打 不 住 了 ,英国 方面 
最 终 下 令 停 工 。 这 样 ,修建 英法 海底 隧道 的 尝试 再 次 失败 。 

第 N 次 尝试 : 1981 年 9 月 11 日 ,英国 首相 撤 切 尔 和 法 国 总 统 密 特 朗 在 
伦敦 举行 首脑 会 晤 ,两 国政 府 深刻 吸取 了 上 次 的 成 本 分 担 教训 ,决定 将 英法 
海底 隧道 的 建设 和 经 营 承包 给 私人 部 门 。 这 个 消息 一 经 放出 ,立马 有 人 响应 
要 接盘 。1984 年 5 月 ,由 多 家 银行 组 成 的 银行 团 向 英法 两 国政 府 提交 了 一 
份 关于 可 以 完全 通过 私人 投资 来 建立 双 孔 海底 铁路 隧道 的 报告 ,论证 了 双 了 筷 
两 条 铁路 隧道 的 方案 在 技术 上 和 财政 上 的 可 行 性 。 银 行 团 后 来 很 快 与 英法 
两 国 的 建筑 公司 联合 在 两 国 分 别 成 立 了 Channel Tunnel Group Limited 
(CTG) 和 France Manche S. A(FM) 公 司 , 这 两 家 公司 再 以 合伙 形式 组 成 欧 
洲 隧道 公司 CTG-FM。 作 为 一 个 由 两 国 建筑 公司 金融 机 构 、 运 输 企业 、 工 
程 公司 和 其 他 专业 机 构 联合 的 商业 集团 ,CTG-FM 在 1985 年 分 为 两 个 组 成 
部 分 ,一 个 是 TML(Transmanche Link) 联 营 体 ,作为 总 承包 商 负责 施工 、 安 
装 , 测 试 和 移交 运行 ; 男 一 个 是 欧洲 隧道 公司 (Eurotunnel) ,作为 业主 负责 运 
行 和 经 营 。 

成 功 通车 : 解决 了 成 本 与 开销 的 分 担 问题 ,这 条 隧道 终于 在 1994 年 5 
月 6 日 举办 了 隆重 的 通车 典礼 (图 2.3)。 看 来 ,最 终 拯救 隧道 的 ,不 是 军事 
战略 ,不 是 政治 需求 ,也 不 是 地 理 问题 ,更 不 是 技术 方案 ,而 是 其 中 的 成 本 与 
利益 分 配 算法 ! 现在 ,每 天 差不多 有 400 列 火车 经 过 海底 隧道 。 截 至 2013 
FE, 通 过 英法 海底 隧道 往来 的 列车 乘客 数量 已 经 达到 了 2040 万 人 次 。 


py 
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图 23 隧道 通车 


无 线 频谱 的 分 配 


锣鼓 喧 天 ,条 炮 齐 鸣 , 红 旗 招 展 , 人 山 人 海 。2016 年 10 月 21 日 至 22 日 ， 
陈 某 某 Another Eason’s Life 演唱 会 在 国家 体育 场 “ 鸟 梨 ” 开 场 演出 ,现场 
片 火爆 ,一 票 难 求 ( 图 2. 4)。 抢 到 票 的 粉丝 难 掩 内 心 的 激动 ,此 刻 最 重要 的 


事 恐 怕 就 是 发 个 朋友 圈 。 


然而 别 说 是 上 网 了 ,这 时 连 个 电话 都 很 难 拨 出 去 …… 当 你 欲 活 无 泪 的 时 
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候 ,请 环顾 四 周 , 看 是 不 是 有 类 似 图 2. 5(a) 的 这 种 车 ? 一 句 话 : 靠近 它 ! 这 
可 能 是 你 唯一 能 在 朋友 圈 展 示 与 偶像 近 距 离 接触 的 机 会 了 。 因 为 它 就 是 传 
说 中 的 移动 基站 (信号 车 )。 通 常 在 人 流量 剧 增 的 时 候 , 为 避免 通信 拥塞 , 主 
办 方 都 会 与 运营 商 协调 ,派出 信号 车 增援 ,开通 临时 信道 。 


TT 


图 25 无 线 信号 车 与 基站 树 


信号 车 到 底 是 怎么 给 我 们 提供 网 络 接 入 的 呢 ? 首先 我 们 知道 提供 无 线 
覆盖 的 是 基站 。 通 俗 地 讲 , 基 站 就 是 公开 场合 的 大 路 由 器 ,用 来 实现 有 线 通 
信和 网 络 与 无 线 终端 之 间 的 无 线 信号 传输 。 

通常 情况 下 会 是 图 2.5(b) 这 样 ,是 一 棵 伪装 成 树 的 基站 ,上 面 密密麻麻 
的 “叶子 ?都 是 采用 ABS 塑料 或 PU 等 高 性 能 防 阻 燃 环保 材料 制 成 ,不 仅 环 
保 , 而 且 防 紫外 线 。 基 站 在 通信 网 络 中 的 位 置 如 图 2. 6 所 示 。 看 不 太 懂 ? 没 
关系 ,你 只 需要 知道 ,基站 负责 把 你 的 手机 接 入 运营 商 网 络 , 之 后 的 事情 就 是 
运营 商 来 全 权 处 理 啦 。 

大 家 之 所 以 能 够 在 家 里 、 学 校 . 地 铁 、 大 街 、 商 店 里 随时 上 网 ,都 是 
为 有 密集 的 基站 网 络 。 然 而 ,随手 一 搜 ,周边 就 能 有 十 几 个 Wi-Fi, 它 们 
无 时 无 刻 不 在 收发 着 各 种 无 线 信号 ,如 此 多 的 基站 为 什么 能 够 互 不 干 
扰 ? 我 们 收 到 的 消息 为 什么 不 会 错乱 ? 这 就 要 感谢 一 位 漂亮 得 不 像 实 
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Ea We 


无 线 终端 最 站 出 “ 核 志 疝 而 


图 26 基站 在 通信 网 络 中 所 处 的 环节 


力 派 的 女神 。 

她 曾 是 艳 绝 一 时 的 明星 ,被 称 为 “世界 上 最 美丽 的 女人 ”。 她 又 是 一 位 
女 发 明 家 ,她 与 他 人 合作 发 明了 “ 扩 频 通信 技术 ”, 被 广泛 用 于 今天 的 手机 、 
卫星 通信 和 无 线 互联 网 。2003 年 ,波音 公司 做 了 一 系列 的 宣传 广告 纪念 
这 位 传奇 的 好 菜 坞 女 明 星 、 科 技 女 性 。 她 就 是 海 蒂 。 拉 玛 (Hedy Lamarr)， 
一 位 美国 影视 女 演员 , 跳 频 技术 的 第 一 发 明 者 ,首次 将 有 线 转 为 无 线 ,被 后 
世尊 为 “CDMA 之 母 "。2014 年 , 海 蒂 。 拉 玛 入 选美 国 发 明 家 名 人 堂 
(National Inventors Hall of Fame) ,图 2.7 是 海 蒂 。 拉 玛 和 她 发 明 的 跳 频 技 
术 专 利 @。 

但 是 ,可 以 在 无 线 通信 中 使 用 的 频段 只 是 电磁 波 频段 中 很 小 的 一 部 分 ， 
因为 有 很 大 部 分 的 频段 是 不 适合 提供 数据 通信 的 。 因 此 ,这 宝贵 的 无 线 通 信 
频段 历来 为 商家 必 争 , 谁 获得 的 频段 宽 , 谁 就 能 用 更 优质 的 服务 提供 人 们 随 
处 上 网 ,也 就 能 收取 更 多 的 流量 费 。 那 么 ,到 底 该 如 何在 不 同 运营 商 之 间 分 
配 无 线 通信 频段 呢 ? 很 多 国家 都 做 过 各 式 各 样 的 探索 ,其 中 最 成 功 的 当 属 英 


@ 细心 的 读者 可 能 注意 到 ,发 明 专 利 上 的 名 字 是 Hedy Kiesler Markey, 没 错 , 这 就 是 海 
蒂 。 拉 玛 , 她 当时 处 于 已 婚 状 态 , 这 是 她 当时 随 丈 夫 姓 改 的 名 字 。 
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图 27 海 蒂 ' 拉 玛 和 她 发 明 的 跳 频 技术 专利 侠 自 美国 发 明 家 名 人 堂 ) 


国 的 3G 频段 拍卖 ,获得 了 225 亿 英 镑 的 收入 , 占 当年 英国 GDP 的 2. 5%。 
当然 ,政府 的 高 额 收益 ,就 意味 着 是 运营 商 的 惨痛 出 血 , 这 场 在 政府 圈子 被 树 


立 为 榜样 的 3G 频谱 拍卖 最 终 导致 了 英国 的 电信 泡沫 。 这 场 拍卖 也 成 
个 不 可 复制 的 神话 。 
下 面 就 让 我 们 来 看 看 神话 是 如 何 产生 的 。2000 年 ,英国 政府 组 织 了 


次 有 史 以 来 最 大 的 3G 频谱 拍卖 ,将 4 个 3G 频段 进行 拍卖 。 当 时 有 4 个 已 


经 具备 很 强 竞 争 力 的 2G 运营 商 , 享 有 非常 大 的 价格 优势 。 因 此 ,政府 考 


采用 升 价 拍卖 ,这 样 可 以 阻止 其 他 公司 进入 后 阶段 的 拍卖 。 这 次 拍卖 采 月 
升 价 拍 卖 中 的 “ 英 式 拍卖 "和 “荷兰 式 拍卖 ”的 综合 模式 , 随 着 升 价 拍 卖 的 
了 ,频谱 价格 在 不 断 提高 ,很 多 小 公司 由 于 成 本 不 足 陆续 退出 竞争 ,在 只 和 习 


= 


a 


下 
下 


家 公司 时 不 再 采用 升 价 拍卖 ,改换 成 “封闭 式 拍卖 ”。 在 这 种 拍卖 方式 下 ， 
每 家 公司 再 也 看 不 到 其 他 人 的 出 价 。 由 于 每 段 频 谱 只 能 卖 给 一 家 公司 ,而 
每 家 公司 也 只 能 购买 一 段 频 谱 , 为 了 避免 成 为 最 后 一 名 而 被 淘汰 出 局 ,大 家 
都 不 得 不 按照 自己 的 能 力 极限 来 出 价 。 就 这 样 , 英 政府 通过 非常 有 利 的 拍卖 


且 
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规则 ,看 到 了 5 家 公司 的 底牌 , 卖 掉 的 这 4 段 频 谱 堪 称 价值 连城 。 

英国 的 巨额 收益 极 大 地 刺激 了 其 他 国家 ,它们 在 看 到 英国 政府 从 3G 频 
谱 中 获得 了 巨大 成 功 以 后 , 争 相 效 仿 。 在 随后 的 几 年 里 ,不 断 有 各 个 国家 打 
算 靠 出 售 频谱 来 提高 GDP ,而 且 多 半 都 在 效仿 英国 的 升 价 拍卖 。 

拥有 5 个 运营 商 的 荷兰 紧 接着 就 宣布 要 出 售 5 个 频段 ,既然 运营 商 和 频 
段 数量 相等 ,那么 他 们 也 决定 采取 升 价 拍卖 的 方式 ,并 预期 那些 边缘 化 的 小 
运营 商 一 定 会 在 升 价 拍卖 的 过 程 当 中 逐步 退出 竞拍 ,从 而 最 终 在 大 公司 身上 
大 赚 一 笔 。 

在 意识 到 自己 的 危险 处 境 之 后 ,一 些 很 有 潜力 的 边缘 公司 开始 与 在 位 官 
员 私下 沟通 ,而 荷兰 的 竞争 政策 和 拍卖 设计 得 不 完善 ,导致 一 些 其 他 非 荷 兰 
本 土 的 企业 也 来 与 当地 官员 搞 合作 (例如 Deutsche Telekom、DoCoMo 等 
等 )。 结 果 这 场 竞 拍 最 终 只 收益 了 30 亿 欧 元 ,与 预想 的 100 亿 欧 元 相差 
其 远 。 

随后 ,2000 年 10 月 份 的 意大利 ,11 月 份 的 瑞士 ,2001 年 的 比利时 、 希 
腊 …… 大 家 纷纷 来 试 水 ,但 均 以 失败 告终 ,都 没 能 再 次 触及 英国 政府 的 价格 
高 峰 。 

什么 样 的 拍卖 才能 获得 成 功 呢 ? 纵 观 所 有 上 述 拍 卖 ,为 什么 即使 相同 的 
策略 也 会 产生 完全 不 同 的 竞拍 结果 ? 参与 竞拍 的 运营 商 们 难道 都 是 针 锋 相 
对 、 你 死 我 活 吗 ? 有 没有 什么 样 的 频谱 分 配方 法 能 够 使 运营 商 们 共 赢 ,又 同 
时 能 创造 最 大 的 社会 效益 ,从 而 皆大欢喜 呢 ? 


谁 来 出 钱 修 跑 道 


香港 在 回归 之 前 原本 有 个 老 机 场 , 名 叫 启 德 机 场 。 启 德 机 场 位 于 九龙 半 
岛 ,跑道 是 在 香港 岛 和 九龙 半岛 之 间 的 维多利亚 海湾 里 填 海 造成 的 。 香 港 岛 
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和 九龙 半岛 都 是 摩天 大 楼 林立 ,飞机 起 降 于 港 岛 和 九龙 半岛 的 两 大 群 水 泥 森 
林 中 间 的 狭长 空隙 走廊 ,20 世纪 90 年 代 的 港 片 中 经 常 出 现 的 飞机 起 降 镜 
头 , 都 是 在 这 里 拍摄 的 。 随 着 香港 经 济 的 发 展 , 启 德 机 场 相当 繁忙 , 客 货 载运 
量 已 趋 饱和 ,由 于 受 地 理 位 置 的 限制 ,已 没有 扩展 的 空间 。 

1989 年 10 月 , 港 英 当 局 忽然 单方 面 提 出 了 一 个 香港 有 史 以 来 最 庞大 的 
基础 设施 建设 计划 一 一 《玫瑰 园 计 划 》, 其 中 包括 在 港 岛 西 南 填 海 兴建 新 机 
场 ,建设 与 新 机 场 配 套 的 通 往 港 岛 的 机 场 铁 路 和 高 速 公路 .桥梁 以 及 港 岛 西 
区 海底 隧道 等 ,总 投资 约 上 千 亿 港元 ,预计 十 多 年 才能 完工 。 

这 些 计划 公布 后 ,香港 和 外 来 的 投资 者 都 不 敢 贸 然 参 与 ,因为 这 些 工 程 
跨越 1997 年 6 月 30 日 香港 回归 中 国之 后 ,涉及 未 来 的 中 华人 民 共 和 国 香 港 
特别 行政 区 政府 (以 下 简称 香港 特区 政府 ), 而 没有 中 国政 府 的 明确 支持 ,这 
些 工程 的 融资 就 困难 重重 。 为 了 解决 这 一 难题 , 英 方才 不 得 不 找 中 方 商谈 。 

中 方 从 香港 的 现实 需要 和 长 远 发 展 考虑 ,赞成 兴建 香港 新 机 场 ( 建 成 后 
的 新 机 场 如 图 2.8)。 中 方 主要 关注 的 是 港 英 当 局 不 能 在 香港 回归 前 把 财政 
储备 都 花 光 ,而 应 给 未 来 的 香港 特区 政府 留 下 足够 的 财政 储备 。 建 设 新 机 场 
应 讲 成 本 效益 ,不 应 让 未 来 的 香港 特区 政府 背 上 沉重 的 债务 包 补 。 


图 28 从 大 帖 山 俯 辐 的 香港 国际 机 场 
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1990 年 7 月 ,英国 外 交 国 务 大 臣 弗 朗 西 斯 。 莫 德 访 华 时 ,中 英 双方 同意 
成 立 专家 组 共同 研究 修建 香港 新 机 场 问 题 。 同 年 10 月 ,中 英 双方 正式 开始 
谈判 @。 然 而 ,1992 年 4 月 ,英国 派出 彭 定 康 取代 卫 奕 信 出 任 香 港 总 督 。 彭 
定康 在 到 任 半 年 之 后 的 1992 年 10 月 7 日 ,公布 了 香港 1994 年 的 区 域 组 织 
选举 和 1995 年 立法 局 选举 的 新 方案 ,把 立法 局 的 间接 选举 改 为 变相 直接 选 
举 , 破 坏 了 "直通 车 方案 "。 然 后 ,他 才 访 问 北京 ,与 国务 院 港澳 事务 办 公 室 主 
任 重 平 会 晤 ,结果 会 晤 中 没有 取得 任何 成 果 。 随 后 , 重 平 召开 记者 招待 会 , 批 
评 彭 定康 的 方案 “三 违反 ”: 违反 《中 英 联 合 声明 》, 违 反 《 基 本 法 》, 违 反 两 国 
外 交 部 长 和 外 交大 臣 达 成 的 协议 "要 成 为 香港 的 千古 罪人 ”。 

总 之 ,在 新 机 场 建设 与 成 本 分 摊 的 问题 上 ,中 英 双方 一 直 存 在 着 激烈 的 
斗争 。 

让 我 们 假设 有 5 家 航空 公司 要 准备 联合 建造 一 个 新 机 场 ,但 这 几 家 航空 
公司 飞机 的 机 型 不 同 ,对 跑道 长 度 和 承受 压力 等 要 求 也 都 各 不 相同 ,这 无 疑 
会 增加 成 本 分 摊 的 复杂 度 。 

由 于 适合 大 型 飞机 的 跑道 必定 可 以 容纳 小 型 的 飞机 ,然而 反之 不 然 ,为 方 
便 起 见 ,我 们 假设 每 家 航空 公司 只 拥有 单一 机 型 ,各 家 公司 的 机 型 互 不 相同 。 
按照 机 型 由 小 到 大 ,我 们 用 A、B.C.D、E 来 描述 这 5 家 航空 公司 ,很 显然 ,A 公 
司 单独 建立 一 个 小 型 跑道 ,足以 供 自己 小 型 飞机 的 起 降 , 假 设 其 成 本 为 cs。 而 
如 果 玉 公司 想 要 单独 建设 一 个 跑道 ,要 花费 的 成 本 cs 远 远大 于 cA。 常识 告诉 
我 们 ,这 5 家 公司 如 果 共 同 修建 这 个 大 跑道 的 话 , 总 成 本 仍然 是 ce ,所 以 在 一 般 
情况 下 ,共同 修建 跑道 将 使 得 每 家 公司 都 有 可 能 节省 一 笔 成 本 费用 。 

但 是 问题 来 了 ,这 5 家 航空 公司 到 底 该 如 何 分 摊 这 cs 的 总 成 本 呢 ? 如 果 
通过 谈判 和 协商 ,能 够 达成 合作 协议 ,那么 便 可 以 皆大欢喜 。 然 而 ,倘若 谈判 


@ 姜 恩 柱 .大 国 较 量 : 中 欧 关系 与 香港 回归 亲历 . 北京 : 中 信 出 版 社 ,2016. 
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破裂 ,事情 也 未 必 会 演变 成 5 个 大 大 小 小 不 同 的 跑道 ,因为 这 5 家 航空 公司 
必然 会 形成 子 联盟 。 设 想 一 下 , 若 A 公司 和 下 公司 联手 合作 建成 一 个 机 场 ， 
它们 采用 了 一 个 非常 简单 的 成 本 分 摊 , 分 别 承担 cs/2 和 (cs 一 cA/2) ,那么 这 
个 结果 已 经 明显 低 于 各 自 独立 建设 机 场 跑 道 的 成 本 cs 和 cs。 这样 一 来 ,在 
这 场 5 家 航空 公司 的 谈判 过 程 中 ,A 公司 和 王公 司 的 “底线 ?就 已 经 降低 到 了 
ca/2 和 (cs 一 cA/2)。 然 而 ,类 似 这 样 的 子 联盟 可 以 有 许 许 多 多 ,参与 公司 的 
数量 又 不 限于 两 家 ,因此 ,我 们 不 得 不 面临 众多 联盟 之 间 的 相互 作用 问题 , 因 
为 这 些 子 联盟 之 间 的 博弈 关系 ,决定 着 每 家 公司 在 成 本 分 担 中 能 够 接受 的 价 
格 “底线 ”, 也 就 决定 着 能 否 达 成 最 终 合 作 建 设 跑道 的 协议 。 

经 过 中 英 联合 联络 小 组 和 专家 组 等 一 系列 会 谈 , 双 方 于 1991 年 夏 达 成 
协议 ,形成 了 一 个 书面 文件 , 即 (关于 香港 新 机 场 建设 及 有 关 问 题 的 谅解 备 忘 
录 》。 该 谅解 备忘录 确定 ,新 机 场 建设 要 符合 成 本 效益 ,本 着 不 在 财政 上 给 香 
港 特区 政府 造成 负担 的 原则 。 有 具体 规定 : 在 1997 年 6 月 30 日 前 , 港 英 政府 
“将 在 最 大 程度 上 完成 ”机 场 核 心 项 目 建设 ;跨越 1997 年 6 月 30 日 偿还 的 债 
务 总 额 不 超过 50 亿 港 元 ,如 超过 , 须 由 双方 磋商 ; 港 英 政府 将 预 留 250 亿 港 
元 财政 储备 给 未 来 的 特区 政府 人 。 


功利 主义 的 分 配方 案 一 一 Shapley 值 


一 个 人 的 价值 ,应 当 看 他 贡献 什么 ,而 不 应 当 看 他 取得 什么 。 
一 一 爱 因 斯 坦 


@@ 姜 恩 柱 .大 国 较 量 : 中 欧 关 系 与 香港 回归 亲历 . 北京 : 中 信 出 版 社 ,2016. 
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通过 上 面 几 个 例子 ,我们 已 经 看 到 ,争端 以 及 争端 能 够 得 以 解决 ,合作 以 
及 如 何 合作 ,都 离 不 开 一 个 前 提 , 那 就 是 参与 各 方 的 利益 分 配 问题 。 这 些 问 
题 同样 出 现在 今天 的 共享 经 济 里 ,但 幸运 的 是 ,今天 我 们 可 以 用 Shapley 值 
来 精确 计算 出 参与 方 做 出 的 贡献 以 及 该 如 何 更 加 公平 地 分 配合 作 收益 。 


Shapley 值 ,一 个 天 才 提 出 的 天 才 理 论 


提出 Shapley 值 的 罗 伊 德 . 沙 普 利 (Lloyd Shapley, 下 文 简称 沙 普 利 ) 是 
位 传奇 人 物 。 他 出 生 于 1923 年 6 月 2 日 的 美国 麻 省 剑桥 镇 ,一 个 有 着 浓郁 
科学 氛围 的 家 庭 。 沙 普 利 的 父亲 哈 罗 . 沙 普 利 (Harlow Shapley) ,是 一 位 车 
名 的 天 文学 家 。 作 为 哈 罗 “' 沙 普 利 五 个 孩子 中 的 第 四 个 , 沙 普 利 在 哈佛 大 学 
天 文 台 台 长 官 娃 长 大 成 人 ,很 早 就 显露 出 数学 天 分 。 沙 普 利 后 来 在 回忆 中 
提 到 : 

“我 有 两 个 聪明 的 哥哥 ,他 们 都 是 课程 全 优 的 学 生 , 并 且 我 猜 我 的 姐姐 也 
很 聪明 。 然 而 ,有 时 候 我 们 在 家 里 会 用 纸牌 玩 诸 如 数学 乘法 运算 有 关 的 游 
戏 , 我 能 够 从 想方设法 胜出 他 们 的 过 程 中 得 到 一 种 激励 。 虽 然 他 们 比 我 大 四 
到 六 岁 , 但 我 的 表现 相当 出 色 , 由 此 我 在 家 里 得 到 一 个 数学 奇才 的 名 声 。” 

1943 年 ,在读 大 二 的 沙 普 利 被 送 到 位 于 北 卡 罗莱 纳 的 新 兵 训练 营 , 开 始 
了 三 年 军旅 生涯 。 在 军队 服役 期 间 , 沙 普 利 会 写 信 回 家 ,当然 信 中 的 一 切 内 
容 都 会 受到 审查 ,他 甚至 不 能 让 家 人 知道 他 在 什么 地 方 。 为 了 让 家 人 们 知道 
他 的 位 置 ,他 构思 了 一 个 真实 的 探测 信件 ,在 其 中 提 到 一 些 事情 如 他 的 “查理 
叔叔 (Uncle Charlie)”, 这 些 事情 不 会 受到 审查 员 的 注意 ,但 是 会 向 家 人 传达 
出 信息 ,这 封 信 的 含义 并 不 在 单词 里 (家 里 从 来 就 没有 过 一 个 名 叫 “ 查 理 ” 的 
叔叔 )。 后 来 他 的 哥哥 威 利 士 * 沙 普 利 (Willis Shapley) 想 到 ,原来 它 的 意思 
在 于 信 中 每 一 行 的 第 一 个 字母 : CH-LN-A, 从 而 知道 沙 普 利 那 时 已 经 到 达 


54 


第 2 章 ”共享 经 济 该 如 何 共 分 利益 


了 遥远 的 中 国 。 

服役 结束 后 , 沙 普 利 回 到 了 哈佛 大 学 ,他 曾 一 度 迷 茫 ,直到 他 被 兰 德 公 司 
录用 。 

兰 德 公司 在 公众 中 的 知名 度 并 不 高 ,但 它 的 实际 影响 力 却 很 大 。 兰 德 公 
司 被 称 为 美国 的 “智库 ”, 它 影响 和 左右 着 美国 的 政治 .经济 .军事 .外 交 等 一 
系列 重大 事务 的 决策 ,有 意思 的 是 , 它 是 一 个 非 营利 的 民办 研究 机 构 , 独 立地 
开展 工作 ,与 美国 政府 只 是 客户 合同 关系 。 兰 德 公司 的 研究 成 果 举 世 瞩 目 。 
已 发 表 研究 报告 18 000 多 篇 ,在 期 刊 上 发 表 论 文 3100 篇 ,出 版 了 近 200 部 
书 。 在 每 年 的 几 百 篇 研究 报告 中 ,5% 是 机 密 的 ,95% 是 公开 的 ,而 这 5% 的 
保密 报告 随 着 时 间 的 推移 也 在 不 断 解密 。 这 些 报告 中 ,包括 "中国 21 世纪 的 
空军 ”中 国 的 汽车 工业 ”日 本 的 防御 计划 ”日 本 的 高 科技 “俄罗斯 的 核 力 
量 ”“ 韩 国 与 朝鲜 ”数字 化 战场 上 的 美国 快速 反应 部 队 ” 等 重要 课题 。 

“ 军 方 认为 应 该 在 战 后 继续 与 科学 家 群体 保持 联络 ,给 他 们 分 配 一 些 任 

务 和 资金 ,让 科学 家 思考 问题 并 告诉 军 方 有 关 的 一 切 。 这 是 一 种 广泛 而 开放 
的 与 空军 之 间 的 合同 。 这 导致 一 些 人 如 约翰 。 廉 斯 把 相当 多 的 各 种 各 样 的 
人 组 织 在 一 起 。 他 从 数学 系 雇用 了 一 些 疯狂 的 天 才学 生 , 包 括 我 。 沙 普 利 在 
接受 采访 时 对 记者 说 。 
在 兰 德 公司 (美国 政府 的 智囊 团 公司 ) 中 有 一 个 小 组 决定 研究 博弈 论 。 他 们 
组 织 研讨 会 ,每 周 见面 ,研读 (博弈 理论 和 经 济 行为 ) 其 中 的 一 章 。 这 本 书 最 初 在 
1944 年 出 版 ,标志 着 博弈 论 这 一 新 的 数学 分 支 的 正式 创立 ,从 此 , 当 我 们 需要 分 
析 多 个 有 利益 冲突 的 参与 者 之 间 的 合作 与 竞争 问题 时 ,就 有 了 新 的 工具 。 

“ 冯 “。 诺 依 曼 和 奥斯卡 。 摩 根 斯 坦 恩 这 本 书 的 出 版 ,是 相当 了 不 起 的 事 
情 。 我 采用 1947 年 的 版 本 即 原 书 的 第 二 版 ,其 中 只 是 简单 地 增加 了 一 些 附 
录 。 这 本 书 问 世 以 来 ,没有 引起 太 大 达 动 和 广泛 的 评论 ,无 论 如 何 , 冯 。 诺 依 
曼 已 经 是 大 名 史 鼎 的 科学 家 ,但 是 除了 这 些 以 外 ,并 没有 什么 事情 发 生 。” 
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由 于 参加 研讨 会 , 沙 普 利 得 以 与 另外 一 位 数学 家 埃 尔 文 ， 罗 斯 (Alvin 
E.Roth) 一 起 工作 ,解决 该 书 中 提出 的 一 个 问题 ,怎样 寻找 矩阵 博弈 所 有 的 
解 。 他 们 共同 解决 了 这 个 问题 ,因此 它 被 命名 为 Shapley-snow 解 。 然 而 ,这 
是 沙 普 利 在 没有 阅读 大 量 数学 论文 情况 下 完成 的 ,他 对 这 个 解 能 够 用 来 做 什 
么 也 没有 特别 清晰 的 概念 。 

冯 ' 诺 依 曼 (Von Neumann) 读 了 他 们 的 文章 ,非常 感 兴趣 ,因为 在 那个 
时 期 很 少 有 论文 讨论 有 关 博 弈 论 的 问题 。 

那 时 站 。 诺 依 曼 或 许 出 于 个 人 自尊 ,尽管 他 已 经 不 再 做 有 关 博 弈 论 的 工 
作 , 还 是 对 他 们 的 工作 鼓励 一 香 。 他 那 时 主要 在 思考 计算 机 方面 的 问题 ,他 
想 鼓 励 他 们 继续 去 做 ,为 此 写 了 热情 洋溢 的 评论 ,表示 他 对 此 非常 兴奋 ,他 将 
会 出 版 它 , 也 将 会 推荐 一 个 指定 的 期 刊 去 发 表 等 等 。 

在 兰 德 公司 工作 不 到 两 年 后 , 沙 普 利 前 往 普 林 斯 顿 大 学 继续 研究 生 学 
习 , 在 数学 家 艾 伯 特 ， 图 克 (Albert Tucker) 的 指导 下 沙 普 利 完成 了 博士 论 
文 “集合 函数 的 可 加 性 和 非 可 加 性 ”。 同 一 时 期 在 那里 他 发 表 了 几 篇 其 他 方 
面 的 论文 ,包括 1953 年 发 表 的 一 篇 名 叫 * 多 人 博弈 的 价值 (A Value for n- 
person Games )” 的 文章 , 正 是 这 篇 文章 引入 了 如 今 被 大 家 广泛 知晓 的 
“Shapley 值 ”, 这 是 一 个 有 关 合 作 博 弃 解 的 概念 。 

沙 普 利 在 创立 Shapley 值 这 个 概念 后 不 久 便 开始 考虑 它 的 应 用 。 他 与 马 
丁 ， 苏 比 克 (Martin Shubik) 一 同 工 作 ,将 它 用 于 在 选举 中 度量 影响 力 。 这 些 工 
作 导 致 了 一 个 被 称 为 Shapley-Shubik 影响 力 指数 的 出 现 。 他 们 两 人 作为 不 知 
名 的 研究 生 , 一 个 学 习 数学 ,一 个 学 习 经 济 学 ,有 点 不 知 天 高 地 厚 地 将 这 篇 论文 
提交 给 顶级 的 政治 科学 杂志 , 令 人 吃惊 的 是 在 几 周 之 内 就 被 接受 了 。 
图 2. 9 是 沙 普 利 在 2012 年 诺 贝 尔 经 济 学 奖 颁 奖 典礼 上 做 演讲 的 照片 和 
他 1953 年 发 表 的 A Value forn-person Games 文章 封面 。 请 注意 , 沙 普 利 获 
得 诺 贝尔 奖 的 贡献 是 他 在 稳定 匹配 方面 的 研究 成 果 ( 第 3 章 会 介绍 ) ,但 作者 
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认为 Shapley 值 至 少 和 他 在 稳定 匹配 方面 的 成 果 同 样 重要 ,如 果 不 是 更 重要 
的 话 。 
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图 29 沙 普 利 在 W212 年 诺 贝尔 经 济 学 奖 颁奖 典礼 上 的 照片 和 


他 1958 年 发 表 的 AValue for nperson Games 


用 边际 贡献 率 解 决 分 配 的 公平 性 问题 


一 项 工作 ,只 要 有 多 个 参与 方 ,那么 就 涉及 合作 博弈 和 利益 分 配 问题 ， 
Shapley 值 的 最 大 贡献 就 是 解决 了 合作 博弈 中 各 方 的 利益 分 配 。 

我 们 用 一 家 农产品 供应 商 来 举例 。 如 果 他 准备 卖 掉 刚刚 收获 下 来 的 苹 
果 , 他 可 以 自己 去 市 场 上 卖 ,也 可 以 拿 到 农产品 展销 会 上 去 卖 。 如 果 他 自己 
去 市 场 上 卖 的 话 ,这 些 苹果 可 以 卖 2000 元 钱 ; 如 果 拿 到 展销 会 上 去 卖 ,可 以 
卖 到 4000 元 钱 。 对 于 农产品 展销 会 来 说 ,如 果 不 接 受 这 家 供应 商 的 苹果 ,而 
是 接受 其 他 小 商家 的 农产品 ,收入 仅 为 1000 元 。 这 样 一 来 ,如 果 两 家 达成 合 
作 , 展 销 会 上 售卖 这 家 供应 商 的 苹果 ,那么 两 家 总 收益 为 4000 元 ;如 果 各 
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为 营 ,总 体 收益 为 3000 元 。 显 然 , 从 总 体 收益 来 看 ,供应 商 和 展销 会 合作 才 
是 最 有 效 的 。 那 么 ,在 合作 过 程 中 ,苹果 出 售 赚 取 的 4000 元 应 该 如 何 分 配 ? 
供应 商 和 展销 会 应 各 拿 多 少 ? 

为 解决 这 个 问题 ,我 们 首先 要 了 解 双方 的 谈判 力度 如 何 , 也 就 是 说 ,双方 
对 于 达成 合作 做 出 的 贡献 大 小 ,博弈 论 中 将 这 样 的 贡献 称 为 边际 贡献 。 其 个 
参与 人 的 边际 贡献 就 是 指 他 参与 合作 与 不 参与 合作 ,对 整体 效益 产生 的 利润 
之 差 。 在 这 个 例子 当中 ,缺少 供应 商 或 者 展销 会 任何 一 方 的 合作 ,总 体 的 收 
益 之 和 都 将 变 为 3000 元 ,所 以 双方 的 边际 贡献 都 是 1000 元 ,也 就 是 说 ,离开 
任何 一 方 , 这 1000 元 的 增值 都 不 会 实现 。 这 表明 ,在 这 场合 作 当中 ,双方 的 
边际 贡献 一 共 是 2000 元 ,各 自 占 据 1/2, 双 方 的 谈判 能 力 是 对 等 的 。 那 么 ， 
当 两 个 人 的 边际 贡献 相等 时 ,合作 带 来 的 剩余 收益 应 该 平均 分 配 。 因 此 ,在 
这 4000 元 的 利润 分 配 中 ,供应 商 应 得 到 2500 元 ,展销 会 应 得 到 1500 元 。 

那么 , 当 有 更 多 的 参与 方 想 要 加 入 ,各 方 组 成 大 联盟 的 时 候 ( 例 如 ,有 广 
告 商 想 趁 此 展销 会 的 机 会 做 产品 宣传 ) ,仍然 需要 计算 各 参与 方 的 边际 贡献 ， 
那么 就 需要 将 所 有 参与 人 进行 排列 ,然后 让 他 们 按照 排列 顺序 逐个 加 入 联 
上 盟 , 依 次 计算 当 他 加 入 到 这 个 联盟 之 时 ,为 联盟 做 了 多 少 边际 贡献 。 但 问题 
是 , 排 在 后 面 进 入 联盟 的 人 往往 会 占 很 大 优势 ,因为 每 个 人 的 边际 贡献 计算 
的 是 当 他 进入 联盟 时 ,他 与 前 面 所 有 已 经 进入 联盟 的 人 联盟 所 产生 的 边际 获 
利 。 因 此 ,每 个 参与 人 都 希望 自己 加 入 联盟 的 位 置 尽量 靠 后 。 

为 了 解决 这 个 问题 , 沙 普 利 设想 了 一 个 办 法 ,可 以 使 每 个 人 都 处 在 一 个 
有 相等 可 能 性 的 顺序 位 置 上 。 具 体 做 法 是 ,将 每 位 参与 方 的 Shapley 值 定义 
为 在 全 部 n! 种 可 能 的 排列 顺序 下 ,每 人 对 应 的 边际 一 利 向 量 的 算术 平均 值 。 
在 排列 o 中 ,如 果 用 P"(i) 表 示 排 在 参与 方 i 前面 进入 联盟 的 人 的 集合 ,vw(S) 
表示 联盟 S 的 总 体 收益 ,那么 参与 人 i 在 这 个 n 人 联盟 的 Shapley 值 $; 可 以 
简单 地 表示 为 : 
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= PD U 人 0) 一 ozCPrCD)) 


712 .ExCN) 


其 中 ,o(P" GD U{z) 一 wCP" GD) 表示 在 参与 人 Ai 加 入 联盟 之 时 ,产生 的 边际 
效用 。 对 于 24! 种 排列 , 取 边 际 效 用 的 平均 值 , 即 为 参与 人 i 在 该 联盟 中 的 
Shapley 值 。 
公式 太 复杂 没 看 懂 ? 没关系 ,看 下 面 的 例子 ,你 很 快 就 会 明白 。 


程序 员 鼓 励 师 


Shapley 值 的 用 途 十 分 广泛 ,实际 上 ,凡是 多 人 合作 需要 商量 收益 如 何 分 
配 的 场景 ,都 可 以 尝试 使 用 Shapley 值 。 

程序 员 鼓 励 师 一 直 被 认为 是 一 个 网 络 段子 ,但 近年 来 却 成 为 越 来 越 多 互 
联网 公司 造福 员工 的 常用 手段 。“ 男 女 搭 配 , 干 活 不 累 ”, 有 业内 人 士 指出 , 公 
司 适当 增加 女 员 工 比例 ,确实 有 助 于 办 公 室 氛 肝 的 和 谐 。 

知 乎 网 上 一 位 网 友 给 出 了 如 下 一 个 问题 : 

菜 互联 网 公司 今天 加 班 ,需要 编写 一 个 500 行 的 程序 代码 ,产品 经 理 找 
了 三 个 程序 员 来 完成 ,按照 完成 量 发 奖金 : 1 号 普通 程序 员 独 立 能 写 100 行 ， 
2 号 大 神 程序 员 独 立 能 写 125 行 ,3 号 美女 程序 员 能 写 50 行 。 但 如 果 程 序 员 
两 两 合作 ,会 产生 不 同 的 编码 效率 : 1 与 2 号 合作 能 写 270 行 ,2 与 3 号 合作 
能 写 350 行 ,1 与 3 号 合作 能 写 375 行 ( 请 自行 脑 补 : 美女 都 是 催化 剂 , 码 农 
都 是 潜力 股 )。 当 然 ,三 名 程序 员 共 同 合作 能 完成 500 行 。 

车 共有 1000 元 项 目 奖金 ,该 如 何 给 这 三 名 程序 员 分 配 呢 ? 

下 面 ,我 们 尝试 用 Shapley 值 进行 计算 。 首 先 ,计算 可 能 的 联盟 数量 。 
显然 ,三 个 人 的 联盟 形成 方法 一 共有 6 种 : 

(1) 1 号 邀请 2 号 加 入 组 成 S 联盟 ,3 号 加 入 S 联盟 ; 
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(2) 
(3) 
(4) 
(5) 
(6) 


1 号 邀请 3 号 加 入 组 成 S 联盟 ,2 号 加 入 S 联盟 ; 
2 号 邀请 1 号 加 入 组 成 S 联盟 ,3 号 加 入 S 联盟 ; 
2 号 邀请 3 号 加 入 组 成 S 联盟 ,1 号 加 入 S 联盟 ; 
3 号 邀请 1 号 加 入 组 成 S 联盟 ,2 号 加 入 S 联盟 ; 
3 号 邀请 2 号 加 入 组 成 S 联盟 ,1 号 加 入 S 联盟 。 
按照 Shapley 值 的 计算 过 程 ,下 一 步 需 要 计算 每 位 程序 员 的 边际 贡献 ， 
如 表 2. 2 所 示 。 


表 2.2 程序 员 边 际 贡 献 


可 能 性 | 加 入 顺序 | ”1 号 的 边际 贡献 2 号 的 边际 贡献 3 号 的 边际 贡献 
7 
亲民 下 
re rr ee 
rs ee 
re 
er re 
由 表 2.2 可 知 : 
1 号 普通 程序 员 的 Shapley 值 为 : 
计 (100 十 100 十 145 十 150 十 325 十 150) 一 2 
2 号 大 神 程序 员 的 Shapley 值 为 : 
证 (170 十 125 十 125 十 125 十 125 二 300) = 
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3 号 美女 程序 员 的 Shapley 值 为 : 
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证 (230 十 275 十 230 十 225 十 50 十 50) 一 E 

三 人 Shapley 值 的 总 和 正好 等 于 500。 

所 以 ,根据 Shapley 值 ,1 号 普通 程序 员 应 该 获得 的 奖金 为 : 1000 X 
32. 33% 一 323. 3 元 ,2 号 大 神 程序 员 应 该 获得 的 奖金 同样 为 323. 3 元 ,3 号 
美女 程序 员 应 该 获得 的 奖金 为 总 奖金 的 35. 33%, 即 353. 3 元 。 看 来 ,在 这 个 
算法 定义 的 世界 ,长 得 美 真 的 是 可 以 当 饭 吃 啊 ! 

我 们 曾 在 2. 1 节 提 出 了 无 线 频谱 分 配 的 问题 ,读者 同样 可 以 试 着 用 
Shapley 值 计 算 一 下 ,或 者 借鉴 文献 Performance and Incentive of Teamwork- 
based Channel Allocation in Spectrum Access Networks (IWQoS'2015) 的 解法 。 


在 我 们 的 赛 博 新 经 济公 众 号 的 推送 中 也 可 以 寻找 到 答案 。 


平均 主义 的 分 配方 案 一 一 核 


财富 分 配 的 差异 与 不 均 是 最 普遍 、 最 持久 的 冲突 之 源 。 
一 一 麻 姆 斯 麦迪 过 ,作家 


什么 是 核 


Shapley 值 是 将 收益 按照 参与 人 的 边际 贡献 率 进 行 分 摊 , 参 与 人 应 获得 
的 收益 等 于 该 参与 人 对 每 一 个 他 所 参与 联盟 的 边际 贡献 的 平均 值 。 那 么 换 
一 个 角度 ,如 果 各 方 贡献 相等 时 ,又 该 如 何 分 配 ? 

让 我 们 回顾 一 下 2. 1 节 中 机 场 跑道 成 本 分 摊 的 例子 。 对 于 5 家 航空 公 
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司 A、B.C、D.\E 的 集合 N, 不 论 以 怎样 的 子 联 盟 来 划分 (Si ,…, Si) ,每 家 航 
空 公司 都 能 感觉 到 大 联盟 N 中 存在 一 个 分 配 ,这 个 分 配 赋予 他 的 和 盈利 至 少 
不 差 于 他 所 属 联盟 S; 能 分 配给 他 的 盈利 (在 这 个 例子 当中 ,分 担 的 成 本 为 
“ 负 和 盈利 ”, 即 要 求 负 盘 利 越 少 越 好 ) ,那么 我 们 就 可 以 称 大 联盟 或 者 联盟 博弈 
具有 内 聚 力 。 

对 于 具有 内 聚 力 的 联盟 博弈 ,如 果 一 个 配置 x 满足 如 下 条 件 : 不 存在 任 
何 S 属于 2* ,使 得 这 个 S 可 以 改善 z ,那么 满足 这 个 条 件 的 配置 全 体 就 是 原 
问题 可 行 配置 集 的 一 个 子 集 , 我 们 称 这 些 配 置 为 这 个 博弈 问题 的 一 个 解 ,这 

“ 核 ? 是 沙 普 利 提 出 的 又 一 个 解决 分 配 问 题 的 理论 。 是 的 , 沙 普 利 的 一 生 
就 是 一 个 大 写 的 天 才 成 长 之 路 ,他 除了 提出 了 被 人 熟知 的 “Shapley 值 ? 之 外 ， 
还 提出 了 令 他 获得 诺 贝 尔 奖 的 Gale-Shapley 匹配 理论 (第 3 章 将 会 提 到 )。 
然而 ,他 还 有 一 个 更 卓越 的 成 就 ,就 是 他 提出 了 * 核 的 概念 。“ 核 ?从 平均 主 
义 的 角度 来 衡量 各 个 不 同 联盟 所 能 带 来 的 福利 ,衡量 的 标准 为 联盟 的 剩余 利 
润 。Shapley 值 是 将 收益 按照 参与 人 的 边际 贡献 率 进 行 分 摊 , 参 与 人 所 应 当 
获得 的 收益 等 于 该 参与 人 对 每 一 个 他 所 参与 的 联盟 的 边际 贡献 的 平均 值 。 
Shapley 值 强调 边际 贡献 , 核 则 更 偏向 于 公平 。Shapley 值 体现 的 是 一 种 功 
利 主义 的 “公平 ”, 而 核 则 体现 的 是 平均 主义 的 公平 性 ,这 是 一 种 同情 与 保护 
弱势 群体 的 分 配方 案 。 

沙 普 利 曾经 回忆 说 :“ 兰 德 公司 从 不 试 着 将 我 拉 入 与 战争 博弈 有 关 的 事 
情 或 此 类 问题 的 研究 ,对 我 来 说 , 兰 德 公司 最 了 不 起 的 地 方 是 他 们 让 我 做 我 
想 做 的 事情 ,我 能 成 功 地 做 我 想 做 的 。 最 终 我 得 到 了 来 自 美国 国家 科学 基金 
会 的 资助 (National Science Foundation,NSF) ,我 在 兰 德 公司 工作 ,但 并 没有 
从 兰 德 公司 领取 薪水 。 我 在 兰 德 公司 比 我 应 该 待 的 时 间 多 了 大 约 10 年 , 因 
为 在 那 段 时间 , 我 的 所 有 支持 来 自 NSF, 这 可 以 让 我 做 任何 吸引 我 的 研究 。” 


r 
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“ 核 ” 来 帮 你 卖 鞋 


有 三 个 局 中 人 甲 、 乙 .两 , 甲 有 一 只 左 鞋 , 乙 和 丙 各 有 一 只 右 鞋 ,这 只 左 土 
和 任 一 只 右 鞋 能 相互 匹配 成 一 双 鞋 , 售 价 100 元 。 单 只 鞋 或 两 只 右 鞋 由 于 无 
法 使 用 而 一 文 不 值 ,所 以 甲乙 、 丙 三 人 所 拥有 的 三 只 鞋 总 价值 仍然 为 100 
元 。 那 么 在 这 场 售卖 当中 ,三 人 应 该 如 何 分 配 这 100 元 的 盔 利 呢 ? 

很 显然 , 甲 在 这 场 博 弈 中 显得 尤为 重要 ,因为 如 果 没 有 甲 的 参与 ,那么 乙 
和 丙 即 便 组 成 联盟 ,他 们 拥有 的 鞋 的 最 终 价 值 仍 然 为 零 。 

“ 核 ? 概 念 为 这 个 联盟 博弈 给 出 了 一 个 唯一 的 解 ,结果 令 人 惊讶 : 甲乙 、 
两 三 人 的 利润 分 配 为 (100, 0, 0) 。 在 这 个 结果 中 , 甲 完全 不 会 受到 乙 和 两 联 
盟 的 威胁 ,因为 他 们 的 联盟 并 不 能 改善 自己 的 被 动 境遇 。 对 于 乙 和 两 来 说 ， 
只 要 他 们 是 理性 的 ,如 果 甲 对 其 中 任何 一 个 人 给 予 哪怕 是 一 丁点 的 鼓励 , 例 
如 , 甲 同意 支付 给 乙 1 元 钱 作为 回报 ,于 是 分 配 结果 变 为 (99, 1, 0), 便 足以 
“引诱 ? 乙 与 甲 组 成 联盟 ,从 而 破坏 掉 与 两 组 成 的 零 收 益 联盟 。 但 是 这 种 方案 
仍然 是 不 稳定 的 ,因为 甲 又 再 次 能 和 丙 组 成 新 的 联盟 ,使 得 上 述 分 配方 案 得 
到 改善 ,因为 乙 背 叛 了 与 丙 的 联盟 , 丙 表示 只 需要 0. 5 元 的 收益 分 配 就 同意 
与 甲 组 成 联盟 ,因此 甲 便 被 两 引诱 而 组 成 了 新 的 分 配方 案 (99.5, 0, 0. 5) ,这 
个 分 配方 案 使 得 甲 和 丙 的 处 境 都 得 到 了 改善 。 如 此 递 推 的 话 , 乙 和 丙 会 一 直 
以 更 小 的 收益 期 望 引诱 甲 与 自己 组 成 联盟 ,因此 最 终 必 将 收敛 到 方案 (100， 
0, 0) ,才能 使 得 甲 不 再 会 寻求 改善 方案 ,而 乙 和 丙 的 联盟 又 不 会 对 这 个 方案 
形成 任何 威胁 。 此 时 , 甲 得 到 100 元 , 乙 和 两 分 别 收获 0 元 , 便 构 成 了 这 个 博 
弈 唯一 的 解 。 

直观 上 看 起 来 ,这 个 解 似乎 有 点 荒 廖 , 但 更 为 荒 雇 的 是 ,如 果 有 100 人 拥 
有 左 鞋 ,101 人 拥有 右 鞋 , 比 起 这 个 庞大 的 基数 ,多 出 来 的 1 只 右 鞋 似乎 是 微 
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不 足 道 的 ,人 们 直观 上 可 能 会 认为 ,此 时 的 左 鞋 与 右 鞋 应 该 值 差不多 等 值 的 
钱 。 但 核 的 概念 仍然 会 给 出 唯一 的 一 个 解 : 若 某 参与 人 拥有 左 鞋 , 获 利 100 
元 , 若 某 参与 人 拥有 右 鞋 , 获 利 0 元 。 

这 种 * 逆 直观 ”的 分 配方 案 与 只 有 三 个 参与 人 时 的 利润 配置 竟然 一 样 , 虽 
然 有 悖 于 直观 ,但 它 基本 符合 经 济 学 的 解释 : 右 鞋 的 供应 一 旦 超过 左 鞋 的 供 
应 ,那么 右 鞋 便 将 一 文 不 值 。 这 个 配置 方案 的 证 明 也 非常 简单 。 这 100 双 土 
的 总 价值 为 10 000 元 ,假设 有 一 个 拥有 右 鞋 的 人 分 得 的 利润 为 1 元 ,那么 翻 
下 的 这 200 个 参与 人 便 只 能 分 得 一 共 9999 元 ,此 时 ,这 200 个 参与 人 不 如 排 
挤 掉 这 个 获 利 1 元 的 右 鞋 持 有 人 ,在 他 们 这 个 200 人 的 子 联 盟 中 共同 分 配 这 
10 000 元 的 利润 ,那么 这 样 就 能 多 获得 1 元 的 收益 ,从 而 改善 这 200 人 的 处 
境 。 与 上 面 三 个 参与 人 的 推理 相同 ,这 样 的 改善 会 一 直 持续 下 去 ,因此 ,在 最 
后 属于 “ 核 ” 的 分 配方 案 中 , 右 鞋 的 持 有 人 必 将 获得 零 收 益 。 

由 于 这 个 结果 与 人 们 的 直观 想象 离 得 比较 远 , 有 一 些 人 因为 这 个 例子 对 
“ 核 ” 提 出 了 责难 ,但 笔者 认为 “ 核 ” 的 概念 还 是 很 吸引 人 的 , 它 毕竟 满足 人 人 
都 认可 的 理性 条 件 , 它 最 大 的 缺陷 应 该 在 于 解数 量 的 不 确定 性 ,因为 有 时 候 
核 可 能 是 空 集 ,也 可 能 有 唯一 解 , 还 可 能 包含 许 许多 多 个 解 ,甚至 无 限 多 个 
解 。 在 这 一 点 上 ,Shapley 值 作为 一 个 “一 点 解 ”, 受 到 了 更 多 研究 人 员 和 应 月 
人 员 的 青睐 。 实 际 上 ,这 两 个 概念 是 从 两 个 不 同 的 角度 分 别 解决 公平 分 配 的 
问题 。 


三 妾 争 产 一 一 千年 难题 是 如 何 得 到 解决 的 


下 面 让 我 们 回 到 前 面 提 到 的 三 妾 争 产 问题 。 直 到 1985 年 , 才 有 人 解决 
了 这 个 问题 ,算是 弄 明 白 了 一 干 多 年 前 的 “ 拉 比 ” 们 的 解决 思路 。 
设 有 三 位 继承 者 ,所 有 继承 者 要 求 的 财产 从 少 到 多 分 别 记 作 c[1] 二 100， 
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c[2] 一 200,c[3] 王 300, 总 财产 已 从 0 开始 慢 慢 增加 。 

当 瓦 很 小 (小 于 150) 的 时 候 , 将 巨 平均 分 给 所 有 继承 者 ,直到 各 方 都 拿 
到 cL[1]/2==50 个 金币 ,此 时 停止 给 继承 者 1 分 配 财产 。 

当 总 财产 继续 增加 (达到 250 个 ) 时 ,将 增加 的 部 分 分 给 剩 下 的 继承 者 2 
和 继承 者 3, 直 到 继承 者 2 也 恰好 拿 到 自己 声明 值 的 一 半 , 即 100 个 金币 ,此 
时 停止 给 她 分 发 财产 。 

当 瓦 继续 增加 (达到 350 个 ) 时 , 则 将 增加 的 部 分 只 分 给 继承 者 3, 直 
到 她 的 损失 与 继承 者 2 相同 ( 即 分 到 了 200 个 金币 ,损失 了 100 个 金币 的 
时 候 ) 。 

当下 继续 增加 (达到 450 个 ) 时 ,将 增加 的 部 分 平分 给 继承 者 2 和 继承 者 
3, 直 到 她 俩 每 人 的 损失 与 继承 者 1 相同 , 即 每 人 损失 50 个 金币 ,其 中 继承 者 
2 分 到 150 个 金币 ,继承 者 3 分 到 250 个 金币 。 

当 总 财产 已 多 于 450 个 金币 时 ,再 将 继续 增加 的 部 分 平分 给 这 三 个 继承 
者 ,直到 所 有 人 都 分 得 自己 所 要 求 的 份额 为 止 (共计 600 个 金币 ) 。 

根据 上 述 分 析 ,我 们 可 以 画 出 按照 这 一 方案 分 配 财产 情况 的 折线 图 ,如 
图 2. 10 所 示 。 


0 50 100 150 200 250 300 350 400 450 500 550 600 


图 210 财产 分 配 折线 图 
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可 以 看 到 ,这 一 分 配方 案 与 《 塔 木 德 ) 中 关于 “三 妆 争 产 ” 的 记载 是 吻合 
的 。 至 此 ,我 们 终于 解决 了 这 一 干 年 难题 。 

当然 ,如 果 这 个 富翁 有 更 多 的 妻子 ,我 们 可 以 很 简单 地 把 三 妾 争 产 问题 
扩展 到 N 妾 争 产 ,还 是 一 样 的 套路 ,最终 的 分 配方 案 仍 然 是 倾向 于 保护 弱者 
的 ,重点 是 让 最 不 满意 的 那 位 妻子 的 不 满意 程度 降 到 最 低 , 换 句 话说 ,大 家 都 
不 太 满意 ,但 是 我 们 尽量 让 最 不 满意 的 那 位 麦子 的 不 满意 程度 低 一 些 , 这 样 
最 不 满意 的 妻子 看 看 其 他 人 ,觉得 大 家 其 实 也 都 差不多 ,也 就 接受 现实 了 。 
在 经 济 学 里 ,这 种 使 得 最 大 的 不 满 最 小 化 的 解 称 为 “ 核 仁 ” 解 。 如 果 前 面 提 到 
的 “ 核 ” 是 非 空 集合 的 话 , 那 么 “ 核 仁 ” 一 定位 于 “ 核 ” 内 。 


没有 绝对 的 公平 


死亡 是 世界 上 最 公平 的 事情 。 
一 一 阿 列 克 谢 耶 维 奇 ,作家 
在 分 配 问题 里 ,公平 性 是 一 个 最 主流 的 参考 标准 。 为 了 达到 公平 性 ,于 
是 有 了 Shapley 值 和 核 。 但 是 ,还 有 些 分 配 中 ,公平 性 不 再 是 衡量 标准 ,或 者 
说 不 可 能 达到 公平 性 ,这 时 候 ,应 该 如 何 分 配 呢 ? 


讨价还价 的 玄机 


在 社会 分 配 问题 中 ,如果 两 个 人 的 能 力 相当 ,对 社会 的 贡献 相等 ,那么 一 
人 一 半 划 分 利益 ,就 能 得 到 最 大 的 收益 ;但 如 果 两 个 人 的 能 力 不 对 等 ,对 社会 
的 贡献 也 不 相同 ,此 时 再 公平 的 划分 利益 ,那么 事情 的 结果 就 会 如 同 “ 三 个 和 
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尚 没 水 喝 ” 一 样 ,每 个 人 都 将 失去 努力 工作 的 动力 。 此 时 ,不 平均 分 配 才能 让 
每 个 人 有 更 大 的 积极 性 。 但 同时 又 要 注意 不 能 过 于 不 平均 ,否则 很 有 可 能 造 
成 “宁可 鸡 飞 蛋 打 , 也 不 让 你 多 得 ”这 样 两 败 俱 伤 、 颗 粒 无 收 的 局 面 。 这 说 明 
“做 蛋糕 ”和 “分 蛋糕 ”的 过 程 不 能 完全 隔离 开 , 因 为 分 蛋糕 的 策略 还 会 影响 蛋 
糕 最 终 能 做 多 大 。 

现在 让 我 们 再 次 来 回忆 一 下 前 面 两 节 中 提 到 的 卖 鞋 问题 和 苹果 展销 的 
问题 。 为 什么 苹果 供应 商 和 展销 会 都 能 在 合作 中 获得 额外 利益 ,而 右 鞋 持 有 
者 却 在 合作 中 竹 自打 水 一 场 空 ? 关键 就 在 于 右 鞋 持 有 者 的 谈判 能 力 ( 或 讨 价 
还 价 能 力 ) 为 0, 因 为 有 他 没 他 都 一 样 ,或 者 说 他 完全 可 以 被 另外 一 个 人 代 
替 。 这 时 ,两 位 右 鞋 持 有 者 就 完全 丧失 了 与 左 鞋 持 有 者 讨价还价 的 能 力 ,也 
就 是 说 ,他 的 谈判 能 力 为 0。 

当 苹果 供应 商 又 找 了 另外 一 家 展销 会 谈 了 合作 之 后 ,事情 也 会 变 得 不 一 
样 了 。 试 想 ,供应 商 与 展销 会 A 合作 ,可 以 卖 出 4000 元 钱 的 总 价格 ,而 供应 
商 与 展销 会 B 合作 ,能 创造 出 6000 元 的 总 价格 。 但 展销 会 B 在 不 与 这 家 供 
应 商 合作 时 ,自己 只 能 赚 得 1500 元 。 那 么 在 供应 商 与 展销 会 B 的 合作 中 , 展 
销 会 B 的 边际 贡献 为 6000 一 1500 一 4000=500 元 。 这 是 因为 ,即使 没有 展销 
会 B, 供 应 商 仍然 能 与 展销 会 A 合作 获得 4000 元 的 总 利润 。 而 供应 商 的 边 
际 效用 为 6000 一 2000 一 1500 王 2500 元 。 供 应 商 与 展销 会 B 的 边际 效用 之 和 
为 3000 元 ,所 以 供应 商 要 占据 5/6 的 比例 ,而 展销 会 B 在 剩余 利润 的 分 配 中 
只 能 占据 1/6 的 比例 。 剩 余 利 润 为 6000 一 2000 一 1500 王 2500 元 ,所 以 供应 
商 分 得 2500X5/6 王 2083 元 的 利润 ,展销 会 B 分 得 2500X1/6=417 元 的 利 
润 。 因 此 ,在 供应 商 与 展销 会 B 的 合作 中 ,这 6000 元 的 总 售 价 , 供 应 商 获得 
2000 十 2083 一 4083 元 ,供应 商 B 获 得 1500 十 417 一 1917 元 。 

注意 ,虽然 供应 商 B 的 加 入 成 功 引诱 了 供应 商 , 使 得 展销 会 A 退出 了 与 
供应 商 的 合作 ,但 正 是 由 于 展销 会 A 的 存在 , 才 使 得 供应 商 的 谈判 能 力 大 幅 
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提升 。 如 果 没 有 展销 会 A 的 存在 ,那么 在 供应 商 与 展销 会 B 的 合作 过 程 中 ， 
双方 的 讨价还价 能 力 即 会 持平 ,所 以 会 平均 分 配 这 2500 元 的 利润 ,供应 商 只 
能 获得 2000 十 2500X1/2 二 3250 元 。 这 多 出 来 的 833 元 ,就 是 由 于 展销 会 的 
可 替代 性 太 高 ,致使 讨价还价 能 力 低 。 

因此 ,为 了 提升 自己 在 合作 中 的 讨价还价 能 力 , 还 是 应 该 去 尝试 与 多 方 
进行 合作 ,对 比 不 同 的 合作 关系 ,才能 寻求 一 种 于 自身 最 有 利 的 选择 。 


分 赃 要 谨慎 


下 面 通过 经 典 的 海盗 分 赃 问 题 ,再 看 一 下 如 何 提 升 自己 的 讨价还价 仙 
力 , 如 图 2.11 所 示 。 


3 号 不 靠 谱 ， 我 只 
能 拉拢 4、5 号 ， 我 
的 方案 (98, 0, 1,1) 


2 [100, 0, 0] [无 节操 支持 3 号 ] ”[ 独 知 ] 
图 21 海盗 分 赃 


在 索马里 有 5 个 海盗 , 某 次 他 们 共同 抢 动 了 100 枚 金币 ,每 一 枚 金币 都 


价值 连城 。 盗 亦 有 道 , 他 们 在 分 赃 的 过 程 中 决定 采取 抓 阁 的 办 法 ,具体 方法 
如 下 : 


首先 ,抽签 决定 自己 的 号 码 : 1 .2、3、4、5。 
之 后 ,由 1] 号 开始 提出 分 配方 案 , 然 后 5 个 人 举 手 表决 , 当 且 仅 当 超过 半 
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数 的 人 同意 他 的 分 配方 案 时 , 才 按照 他 的 提案 进行 分 配 , 若 同意 方案 的 人 数 
不 足 半 数 , 那 么 他 将 被 扔 到 大 海里 喂 落 鱼 。 

如 果 1 号 被 咀 了 营 鱼 ,再 由 2 号 提出 分 配方 案 , 剩 下 4 人 举 手 表决 。 同 
样 , 当 且 仅 当 超过 半数 的 人 同意 他 的 分 配方 案 时 , 才 按 照 他 的 提案 进行 分 配 ， 
若 同 意 方案 的 人 数 不 足 半数 ,那么 他 也 将 被 扔 到 大 海里 喂 鲨鱼 。 

以 此 类 推 。 

若 每 个 海盗 都 是 十 分 聪明 的 人 ,都 能 很 理智 地 判断 得 失 , 从 而 做 出 投票 
选择 。 那 么 ,海盗 们 最 终 的 分 配 结果 是 什么 呢 ? 

这 是 博弈 论 的 经 典 案例 ,如 果 你 是 1 号 海盗 ,你 会 平分 100 枚 金币 ,还 是 
为 了 保命 宁可 交 出 自己 的 部 分 ? 都 错 了 ! 聪明 的 1 号 海盗 做 出 的 分 配方 案 
是 (97, 0, 1, 2, 0) 或 (97, 0, 1, 0, 2)。 也 就 是 说 ,1 号 海盗 给 自己 分 了 97 
枚 金币 ,给 3 号 海盗 分 了 1 枚 金币 ,给 4 号 或 者 5 号 海盗 2 枚 金币 。1 号 海盗 
为 什么 敢 如 此 大 胆 ,给 自己 分 得 这 么 多 金币 呢 ? 为 什么 他 不 担心 自己 的 方案 
得 不 到 其 他 人 的 认可 ,从 而 会 被 扔 到 大 海里 喂 藩 鱼 呢 ? 让 我 们 来 看 一 下 各 位 
海盗 的 理性 分 析 。 这 类 问题 ,一 般 从 最 后 一 个 海盗 倒 推 会 比较 容易 得 到 答 
案 。 在 博弈 论 中 ,这 种 办 法 称 为 着 向 推演 。 

5 号 海盗 : 他 是 最 安全 的 一 个 ,因为 没 人 会 把 他 扔 进 海 里 ,因此 他 的 想法 
也 十 分 简单 ,最 好 是 前 面 的 4 个 人 都 死 光 光 , 那 么 他 就 能 独 吞 这 100 枚 金 
Wh 

4 号 海盗: 他 的 生存 与 否 完全 取决 于 前 面 的 1 一 3 号 是 否 还 活着 ,因为 一 
旦 1 一 3 号 都 咀 了 将 鱼 ,单独 剩 下 他 和 5 号 时 ,无 论 他 提出 怎样 的 分 配方 案 ,5 
号 都 一 定 会 投 反对 票 从 而 把 4 号 扔 到 大 海里 喂 娑 鱼 。 即 使 是 4 号 为 了 保命 
提出 (0, 100) 的 分 配方 案 把 金币 都 给 5 号 ,5 号 仍然 是 有 可 能 投 反 对 票 的 , 毕 
竟 留 下 4 号 早晚 都 会 是 个 安全 隐患 。 所 以 ,理性 的 4 号 必须 要 支持 3 号 , 才 
能 保住 自己 的 性 命 。 
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3 号 海盗 : 聪明 的 3 号 海盗 显然 已 经 看 穿 了 4 号 的 策略 ,所 以 他 肯定 会 
提出 (100, 0, 0) 的 分 配方 案 , 因 为 他 知道 ,即使 在 他 的 分 配方 案 中 4 号 一 无 
所 获 , 他 仍然 会 无 条 件 地 投 赞 成 票 ,那么 再 加 上 自己 的 一 票 ,3 号 就 能 稳 稳 地 
把 这 100 枚 金币 装 进 自己 的 口袋 了 。 

2 号 海盗 : 他 经 过 推理 分 析 ,也 料想 到 了 3 号 海盗 的 分 配方 案 , 所 以 他 决 
定 拉 拢 4 号 和 5 号 ,而 放弃 3 号 的 一 票 ,因此 他 会 提出 (98, 0, 1, 1) 的 分 配方 
案 。 这 个 方案 相对 于 3 号 的 分 配方 案 ,4 号 和 5 号 至 少 可 以 获得 1 枚 金币 , 理 
性 的 4 号 和 5 号 自然 会 觉得 此 方案 对 他 们 来 说 更 有 利 , 从 而 选择 支持 2 号 ， 
不 希望 2 号 出 局 而 由 3 号 来 进行 分 配 。 这 样 ,2 号 可 以 拿 到 3 票 ,分 得 98 枚 
金币 。 

1 号 海盗 : 经 过 层 层 推理 ,1 号 海盗 洞悉 到 了 2 号 海盗 的 分 配方 案 , 因 此 
他 采取 的 策略 是 放弃 2 号 这 一 票 而 去 拉拢 3 号 ,因为 即使 给 3 号 1 枚 金币 ， 
他 也 会 投 赞成 票 的 。 而 对 于 4 号 或 者 5 号 来 说 ,在 2 号 的 分 配方 案 中 获得 1 
枚 金币 ,而 1 号 还 需要 再 拉拢 一 位 支持 者 ,因此 他 需要 给 4 号 或 者 5 号 2 枚 
金币 来 诱惑 他 们 中 的 一 人 支持 自己 而 非 2 号 。1 号 再 加 上 自身 的 一 票 ,97 枚 
金币 就 能 轻松 地 落 入 腰包 了 。 因 此 ,1 号 海盗 提出 的 分 配方 案 是 : 给 自己 97 
枚 金币 ,3 号 1 枚 金币 ,4 号 或 者 5 号 2 枚 金币 。 很 有 意思 的 结果 ,对 不 对 ? 


= 过 


共享 经 济 平台 如 何 设 计 最 优 分 配方 案 


对 于 国家 来 说 ,一 个 国王 的 暴政 的 害处 比 起 不 关心 公共 利益 对 一 个 共和 
国 的 害处 还 要 小 些 。 一 个 自由 的 国家 的 优点 是 它 的 收入 分 配 得 比较 好 ,但 如 
果 分 配 得 较 差 的 时 候 , 则 自由 的 国家 的 优点 是 它 根本 没有 完 臣 ;但 是 当 事 情 
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不 是 如 此 ,不 是 使 国王 的 朋友 和 双亲 发 财 ,而 是 使 参加 政府 的 一 切 人 的 朋友 
和 双亲 发 财 的 时 候 ,那么 一 切 便 都 垮台 了 。 
一 一 重 德 斯 坞 

如 今 ,不 管 是 共享 打车 ,还 是 共享 单车 或 共享 充电 宝 ,共享 经 济 的 商业 模 
式 不 断 推 陈 出 新 ,发 展 如 火 如 茶 , 估 值 也 一 路 峰 升 。 这 些 共享 经 济 模式 赁 什 
么 可 以 这 么 值钱 呢 ? 
共享 经 济 作为 新 兴 经 济 模式 ,说 到 底 ,最 重要 的 一 个 创新 ,就 是 更 好 地 解 
决 了 共享 市 场 中 的 利润 划分 问题 ,因此 共享 平台 的 重要 性 也 日 益 凸 显 。 例 
如 , 滴 滴 公 司 的 存在 ,不 仅 在 于 提供 了 平台 ,从 而 为 司机 和 客户 提供 了 匹配 的 
可 能 性 ,更 重要 的 是 以 一 种 更 为 安全 和 可 靠 的 方式 ,解决 了 双方 合作 的 前 
提 一 一 利益 分 配 问题 。 否 则 一 位 私家 车 车 主 是 无 论 如 何 也 不 会 为 加 班 到 深 
夜 的 你 提供 顺风 车 服务 的 。 

任何 共享 经 济 平台 的 设计 ,都 离 不 开 合 作 机 制 。 网 络 经 济 算法 在 解决 这 
些 问 题 上 正在 饭 露 锋芒 。 


从 滴 滴 想 到 的 一 种 新 型 共享 经 济 分 配 模式 的 可 能 性 


现在 专车 注册 非常 方便 ,不 少 车 主 都 开 起 了 专车 。 开 专车 是 一 种 怎样 的 
体验 ? 其 实 没有 那么 多 体验 生活 的 感觉 , 开 专 车 时 你 就 是 个 司机 。 真 的 能 赚 
钱 吗 ? 南都 记者 专车 司机 修炼 秘籍 曝光 , 跑 了 一 整 天 , 赚 了 125 块 钱 。 

一 一 南方 都 市 报 

2015 年 9 月 ,南方 都 市 报 的 一 位 记者 早上 7 点 出 车 ,晚上 9 点 收 车 ,中 间 
吃 午饭 和 晚饭 休息 了 3 个 小 时 ,当天 出 车 时 间 共 11 个 小 时 。 全 天 一 共 接 了 
20 单 ,流水 费 是 314. 7 元 。 根 据 滴 滴 专车 规定 ,流水 费 的 两 成 归 滴 滴 所 有 ， 
剩 下 的 8 成 归 司 机 所 有 。 除 去 油 钱 , 剩 下 的 就 是 利润 。 由 于 记者 所 使 用 的 车 
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辆 较为 耗 油 , 百 公 里 油耗 为 11 升 左右 , 油 钱 的 成 本 估计 要 占 到 流水 费 的 四 
成 ,也 就 说 ,记者 跑 滴 滴 专 车 的 利润 率 是 40% 。 记 者 一 天 跑 了 11 个 小 时 , 利 
润 为 314.7X40 % 二 125. 88 元 。 

所 以 ,在 你 注册 成 为 滴 滴 司 机 之 前 ,还 是 应 该 首先 去 了 解 一 下 滴 滴 平台 
与 司机 之 间 的 利润 划分 机 制 。 由 于 滴 滴 平台 的 信息 相对 难以 获得 ,我 们 先 看 
一 下 图 2. 12 给 出 的 Uber 司机 的 周 薪 统 计 信息 。 


Uber 司 机 的 周 薪 清单 

1000 元 以 下 125 
1001 至 3000 元 142 
3001 至 5000 元 86 
5001 至 7000 元 49 
7001 至 9000 元 1 
9001 以 上 1 
当 周 收入 最 高 的 Uber 司 机 的 收入 构成 


©©0©0 


注 : 基于 404 个 Uber 司 机 样本 得 出 


212 百度 滴 滴 快 车 吧 上 给 出 的 404 位 Lber 司 机 在 205 年 7 月 的 周 薪 统 计 


滴 滴 的 利润 划分 机 制 


百度 滴 滴 专 车 吧 上 的 一 位 司机 网 友 说 , 滴 滴 的 车 费 和 每 单 的 额外 奖励 都 
是 按 倍数 计算 的 ,他 以 深圳 举例 ,如 果 当 天 滴 滴 是 1.6 倍 奖励 ,那么 计算 方法 
如 下 : 如 果 此 单 客 户 支 付 15 元 ,那么 你 的 车 费 收 入 就 是 (15X0.8X0. 9832) 一 


0. 5 一 11.3 元 。 
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为 什么 要 乘 以 0. 8? 因为 滴 滴 公 司 要 先 扣 20% 。 为 什么 要 乘 以 0. 98323 
因为 滴 滴 下 属 的 所 谓 的 中 介 代 理 公司 要 再 扣 1. 68%( 这 里 注意 ,这 个 1. 68% 
是 滴 滴 没 有 注 明 , 也 是 司机 经 常 算 不 清楚 账目 的 罪恶 黑手 ) ;最 后 这 个 0. 5， 
也 就 是 五 毛 钱 ,是 滴 滴 收 司机 师傅 的 保险 费 。 话 说 每 单 都 是 如 此 扣除 。 

如 果 暂 时 忽略 对 倍数 计算 和 完成 单数 的 奖励 ,以 上 就 是 此 单车 费 计 算 。 


司机 对 于 公司 的 贡献 


2015 年 , 滴 滴 公 司 的 估 值 高 达 2280 亿 元 ,与 此 同时 , 辛 辛 苦 苦 到 处 奔波 
一 整 天 的 司机 只 能 得 到 大 约 12 元 /小 时 的 收入 。 作 为 滴 滴 平台 的 重要 参与 
方 和 利益 创造 者 ,这 样 的 收入 跟 滴 滴 的 估 值 相 比 ,是 否 匹 配 ” 是 否 公平 ? 要 
知道 , 当 我 们 评估 这 2280 亿 元 从 何 而 来 的 时 候 ,免不了 提 及 这 些 12 元 /小 时 
的 司机 们 的 贡献 。 

2016 年 ,由 于 京 沪 两 地 网 约 车 新 政变 得 严 苟 ,快车 合 规 驾 驶 员 数 量 
锐 减 ,而 京 沪 订 单 大 约 占 到 滴 滴 总 量 的 15% ~~20% ,驾驶 员 数 量 的 锐 减 
在 一 定 程度 上 严重 影响 了 滴 滴 的 业务 。2017 年 春节 前 ,在 线 司 机 数量 减 
少 了 25% ,一 位 网 名 为 “ 滴 滴 出 行 高 级 产品 总 监 ” 的 知 乎 用 户 “ 罗 文 ? 指 
出 ,由 于 春节 将 近 ,订单 数量 增长 了 30% ,致使 大 量 用 户 吐 模 滴 滴 又 贵 又 
难 约 ! 

这 些 问 题 促使 我 们 思考 ,是 否 有 一 种 新 的 分 配 形式 ,可 以 更 好 地 将 参与 
各 方 的 利益 绑 定 在 一 起 ? 


如 何 增加 司机 的 参与 感 


2016 年 , 滴 滴 公 司 在 其 公布 的 《移动 出 行 与 司机 就 业 报告 中 称 , 滴 滴 平 
台 上 已 经 有 超过 1500 万 司机 ,覆盖 了 专车 \ 快 车、 出 租车 ,顺风 车 、 代 驾 等 多 
条 业务 线 。 司 机 作为 滴 滴 平 台 的 重要 参与 者 ,究竟 应 该 定位 为 平台 的 商品 还 
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是 平台 的 价值 创造 者 ,恐怕 这 才 是 大 部 分 共享 经 济 在 商业 模式 设计 中 应 该 考 
虑 的 问题 ,水 可 载 舟 亦 可 覆 舟 , 靠 补 贴 拉 来 的 平台 参与 各 方 , 一 定 会 在 补贴 停 
止 时 离开 。 补 贴 是 一 个 无 底 洞 ,虽然 在 平台 建立 之 初 通过 补贴 可 以 拉动 各 方 
参与 ,但 很 显然 它 不 是 一 种 万 能 药 。 在 持续 的 竞争 中 , 靠 补贴 也 许 暂 时 可 以 
拖 死 其 他 同行 ,但 是 一 旦 补贴 停止 ,就 会 发 现 无 论 客户 粘性 还 是 司机 粘性 ,都 
会 迅速 消失 。 

如 果 排 除 市 场 ,政策 等 一 系列 的 因素 ,我 们 可 以 对 司机 的 价值 做 一 个 简 
单 的 趋势 分 析 : 假设 1500 万 司机 中 有 25% 流 失 , 会 给 滴 滴 公 司 造 成 280 亿 
元 的 直接 或 间接 损失 ,那么 这 375 万 位 司机 群体 ,对 于 滴 滴 公 司 估 值 的 边际 
效益 即 为 280 亿 元 ,假设 所 有 司机 们 的 贡献 相同 ,那么 每 位 司机 的 边际 效益 
为 1866.7 元 。 

所 以 , 滴 滴 公 司 一 旦 上 市 ,是 不 是 应 该 给 每 位 司机 派送 1866. 7 元 的 股 
票 呢 ? 

当然 相 比 280 亿 ,1866.7 元 的 数字 并 不 高 。 如 果 375 万 司机 真 的 能 够 带 
来 280 亿 元 利润 的 话 ,1500 万 司机 能 够 带 来 的 就 不 仅仅 是 280X4 王 1120 亿 
元 这 么 简单 了 ,而 是 整个 滴 滴 公 司 的 估 值 2280 亿 元 ! 如 果 此 时 司机 们 能 够 
团结 一 致 与 滴 滴 公 司 谈判 ,那么 团结 起 来 的 司机 数量 越 大 ,每 个 人 的 所 得 也 
就 越 多 。 

当然 ,现实 中 的 问题 并 不 能 这 么 简单 地 分 析 , 上 述 过 程 只 是 尝试 章 
述 平台 与 用 户 之 间 的 合作 关系 。 况 且 随 着 参与 人 数量 的 增多 ,团结 一 致 
的 可 能 性 会 急剧 下 降 。 但 无 论 如 何不 应 该 忘记 ,共享 经 济 的 用 户 也 是 平 
台 价 值 的 创造 者 ,因此 如 何 解决 合作 与 分 配 问题 就 显得 更 为 重要 。 我 们 
或 许可 以 借鉴 苹果 公司 的 例子 ,看 看 共享 利润 模式 如 何 推 动 一 个 公司 的 
价值 成 长 。 
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分 配 的 多 层次 景 率 效 应 , 赛 博 新 经 济 体 的 宿命 


赛 博 新 经 济 体 的 寡 律 效应 


在 2016 年 9 月 苹果 公司 的 新 品 发 布 会 上 ,宣布 iPhone 7 的 售 价 分 为 
5388 元 (32G) .6188 元 (128G)、6988 元 (256G) ,iPhone 7 Plus 则 为 6388 元 
(32G) .7188 元 (128G) .7988 元 (256G) 。 然 而 ,如 果 你 观察 苹果 手机 的 元 器 
件 价格 ,会 发 现 其 利润 率 是 非常 惊人 的 。 

如 图 2. 13 所 示 ,苹果 公司 的 全 球 供应 商 的 利润 位 于 0.5%% 一 4.7%% 之 间 ， 
虽然 他 们 一 起 参与 创造 了 苹果 公司 6000 亿美 金 的 市 值 , 然 而 与 苹果 公司 
58. 5% 的 利润 率 相 比 ,可 谓 是 人 家 吃 肉 你 喝 汤 。 这 里 面 的 中 国企 业 也 不 胜 枚 
举 , 包 括 提 供 镜 头 红外 截止 滤 光 片 的 环 旭 电子 公司 ,提供 液晶 业务 的 锦 富 新 
材 公司 ,提供 扬声器 模 组 的 歌 尔 声学 公司 等 。 但 是 ,类 似 这 样 依附 于 大 平台 
的 合作 企业 ,多 数 都 存在 着 与 此 相同 的 遭遇 。 

这 样 的 利润 分 配 与 宕 律 分 布 十 分 吻合 ,这 并 不 是 苹果 公司 特有 的 例子 ， 
在 任何 一 个 大 型 合作 平台 之 上 ,都 会 存在 这 种 利益 分 配 的 巨大 差异 。 只 要 拥 
有 足够 多 数量 的 参与 方 ,那么 不 管 信息 对 称 与 否 ,只 要 不 存在 结构 性 障碍 , 那 
么 平台 上 的 寡 律 效应 就 会 尤为 凸显 。 

罗 振 宇 在 2017 的 跨 年 演 讲 中 提 到 .BAT 三 家 在 2015 年 大 约 总 共有 员 
工 8 万 人 ,这 8 万 人 一 年 创造 了 2700 亿 的 收入 。 也 就 是 行业 不 到 3% 的 劳动 
力 , 创 造 了 接近 行业 的 一 半 GDP。 相 比 之 下 ,余下 的 这 97% 的 人 创造 的 人 均 
价值 几乎 微不足道 。 

国 网 络 购物 用 户 规模 已 达 4.6 亿 , 各 种 商家 店铺 也 是 层 出 不 
穷 。 以 商会 友 网 站 粗略 统计 指出 ,100 多 万 家 的 店铺 中 ,皇冠 店铺 只 占 到 总 


2016 年 , 吕 


Ey 
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se TR 
(002635) ”中 小 尺寸 LCD、 电 立 ;h 精 密 (002475) 
ipad 所 用 功 宣 绕 屏 、3D 为 六 果 iPad 扣 供 平 
能 性 器 件 采 


板 电脑 、 智 能 手机 
德 赛 电池 购 连接 线 等 
(000049) 菜 宝 高 科 (002106) 
向 苹果 全 系 触摸 屏 产 品 通过 其 
列 供 货 他 厂商 进入 供应 链 


002416 
A (002241) 
苹果 亚太 区 最 大 的 让 和 陋 和 

IPhon 
授权 经 销 商 Pn 
Wh 比亚迪 (002594) 

i > 提供 代 工 服务 参与 
tr 产品 的 研发 与 制造 
截止 湾 光 片 品 造 

国内 中 小 尺寸 ST iPad 和 iPhone 

液晶 显示 器 主 触 措 愉 生产 。 的 小 尺寸 液晶 

要 厂家 之 一 ， 商 业务 

韩国 利润 , 4.7% 
美国 利润, 2.4% 
欧洲 利润 , 1.8% 

a 中 国 大 陆 利润 , 1.8% 
果 公司 ， 工 人 非 中 国 大 陆 利润 , 3.5% 
部 分 和 原料 部 中 国 台湾 地 区 利润 , 0.5% 
分 均 指 成 本 投 
入 上 日 本 利润 , 0.5% 


其 他 利润 , 4.4% 


图 213 苹果 公司 产业 链 及 利润 划分 


数 的 0.22%。 其 中 ,经 营 女装 /女士 精品 类 的 网 店 数 量 最 多 ,为 170 819 家 ， 
但 是 皇冠 店铺 只 有 257 家 , 占 其 中 的 0.15%。 由 此 可 见 , 在 诸如 淘宝 等 大 型 
平台 上 ,众多 商家 之 间 的 客户 量 和 和 盈利 额 ,基本 都 遵从 着 寡 律 分 布 。 当 然 , 这 
种 宕 律 效 应 并 不 仅仅 存在 于 平台 的 各 个 参与 方 , 甚 至 连 平台 本 身 也 难 逃 这 一 
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如 图 2. 14 所 示 ,2015 年 间 ,在 中 国 的 B2C 市 场 中 ,天 猫 的 市 场 份额 位 居 
第 一 ,遥遥 领先 ,京东 次 之 ,位 列 第 二 ,加 上 大 家 耳熟能详 的 苏宁 易 购 .1 号 店 
和 亚马逊 这 几 家 电 商 平台 ,其 他 所 有 小 平台 只 占 了 区 区 6. 3% 的 交易 总 额 。 


亚马逊 中 国 易 迅 网 
.9%、 聚 美 优 


天 猫 
58.0% 


2015 年 中 国 B2C 
购物 网 站 交易 规模 
为 : 2.0 万 亿 


图 214 205 年 6 购 物 网 站 交易 规模 市 场 份额 


在 P2P 平台 方面 , 据 速 途 研究 院 发 布 的 42014 年 11 月 P2P 市 场 报告 ) 显 
示 , 在 全 国 1600 家 P2P 平台 中 ,11 月 份 交易 额 排名 前 十 的 平台 累计 交易 量 
约 为 94 亿 元 , 占 行业 总 成 交 额 的 30%, 而 红 岭 创 投 一 家 的 交易 量 就 为 
yi 

在 第 三 方 支付 领域 , 艾 瑞 咨询 的 数据 显示 , 早 在 2013 年 ,支付 宝 以 27. 8 
亿 笔 .9000 亿 元 的 支付 金额 登 上 了 全 球 最 大 移动 支付 公司 的 宝座 ,其 市 场 份 
额 也 达到 了 惊人 的 78. 4%。 

窒 律 效应 ,简单 来 说 就 是 指 两 个 通俗 的 定律 ,一 是 二 八 定律 ,指出 的 是 不 
平衡 分 布 ,比如 20% 最 富有 的 人 掌握 了 全 部 财富 的 80%, 二 是 马 太 效应 ,所 
描述 的 是 穷 者 越 穷 富 者 越 富 现象 。《 二 十 一 世纪 资本 论 》 用 非常 可 观 的 篇 幅 
再 次 向 我 们 阐述 了 资本 获 利 正在 加 速 的 现实 ,这 正 是 马 太 效应 的 直观 体现 。 

宕 律 其 实 就 是 赢家 通 吃 。 但 这 样 公平 吗 ? 尽管 寡 律 效应 早 在 100 多 年 


77 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


前 就 已 经 由 经 济 学 家 提出 ,然而 在 赛 博 新 经 济 的 环境 下 , 它 的 效应 正在 日 益 
凸显 ,而 且 这 种 效应 正在 由 20 : 80 逐渐 朝 着 0 : 100 的 方向 发 展 ,也 就 是 说 ， 
行业 引领 者 将 有 可 能 占据 接近 全 部 的 行业 利润 ,类 似 于 工业 经 济 时 代 的 垄断 
企业 。 

在 传统 经 济 时 代 , 垄 断 的 存在 一 直 被 认为 是 一 种 对 经 济 发 展 和 社会 稳定 
不 利 的 商业 形态 。 然 而 ,在 赛 博 经 济 时 代 , 平 台 的 震 率 效应 造成 的 赢家 通 吃 
局 面 , 越 来 越 接 近 于 垄断 的 模式 ,甚至 平台 的 多 边 化 发 展 也 正 渐渐 形成 一 种 
比 垄 断 更 为 强大 的 多 边 市 场 的 独占 经 济 。 

若 平 台 本 身 既 是 合作 过 程 的 获 利 者 ,又 是 合作 规则 的 制定 者 ,那么 它 将 
很 难保 证 平台 上 各 参与 方 的 利益 ,甚至 由 于 平台 的 贪 禁 性 ,会 导致 大 部 分 的 
“长 尾 ” 参 与 方 利益 受 损 。 我 们 不 能 仅仅 依靠 那 种 缺乏 中 立 性 的 平台 的 自律 
来 替代 第 三 方 监管 。 否 则 ,这 种 不 公平 的 分 配方 式 将 会 愈演愈烈 ,直到 破坏 
新 经 济 的 生态 平衡 。 今 天 ,算法 为 我 们 建立 一 个 更 为 公平 的 赛 博 市 场 提供 了 
可 能 性 。 我 们 可 以 借助 算法 ,更 为 精确 地 计算 合作 博弈 的 各 方 利益 如 何 合理 
分 配 , 这 也 将 为 赛 博 经 济 新 秩序 如 何 建立 提供 一 种 新 的 思路 。 
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青春 小 说 作家 郭敬明 写 过 这 样 一 段 文 字 : 

“我 相信 这 个 世界 上 一 定 有 一 个 你 爱 的 人 ,他 会 穿越 这 个 世间 油 涌 的 人 
群 , 怀 着 一 颗 用 力 跳 动 的 心 , 捧 着 满腔 的 热 和 沉 甸 多 的 爱 ,走向 你 ,抓紧 你 ,他 
一 定 会 找到 你 的 ,你 要 等 。” 

这 是 我 们 对 择偶 这 件 事 的 文艺 化 表述 。 然 而 ,现实 总 是 残酷 的 ,如 果 你 
真 的 这 样 等 下 去 ,很 可 能 你 最 终 一 无 所 获 。 要 知道 ,虽然 “对 的 人 ”并 不 是 唯 
一 的 ,每 个 单身 人 士 ,无 论 高 矮 胖 瘦 , 有 什么 样 的 职业 和 爱好 ,都 会 有 成 干 上 
万 个 “对 的 人 ” 跟 你 匹配 , 令 你 动心 。 但 是 ,就 算 * 对 的 人 ”成 干 上 万 , 谁 都 不 能 
保证 必然 有 一 个 会 穿越 测 涌 的 人 群 找到 你 。 好 消息 是 ,只 要 你 正常 地 在 这 个 
世界 上 工作 和 生活 ,有 正常 的 社交 ,那么 一 定 存在 一 个 “对 的 人 ”。 坏 消息 是 ， 
茫茫 人 海 , 你 如 何 才能 找到 他 ? 
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如 何在 网 上 搜 到 一 个 靠 谱 的 女 朋友 


要 想 美好 地 度 过 一 生 , 就 只 有 两 个 人 结合 ,因为 半 个 球 是 无 法 滚动 的 ,所 
以 每 个 成 年 人 的 重要 任务 就 是 找到 和 自己 相配 的 另 一 半 。 
一 一 卡尔 。 马克思 


在 加 州 大 学 洛杉矶 分 校 的 一 座 教学 楼 里 ,35 岁 的 里 斯 。 麦 金利 (Chris 
McKinlay) 正 试图 用 OkCupid( 美 国 最 流行 的 在 线 约会 网 站 ) 来 找到 这 个 “对 
的 人 ”。 相 比 现实 中 的 约会 ,在 线 交 友 网 站 更 简单 直接 , 极 大 提高 了 人 们 找到 
“对 的 人 ”的 几率 。 

OkCupid 创办 于 2004 年 ,其 联合 创始 人 Chistian Rubber 毕业 于 哈佛 大 
学 数学 系 。OkCupid 最 吸引 交友 者 的 是 ,他 的 相亲 对 象 是 通过 计算 方法 来 自 
动 匹配 的 。 成 员 通 过 回答 一 系列 问题 进行 匹配 ,比如 政治 宗教 .家 人 、 爱 情 
观 甚至 性 取向 等 。 在 4000 万 通过 Match. com、J-Date、e-Harmony 这 些 在 网 
络 上 寻找 姻缘 的 用 户 中 , 麦 金 利 当然 不 会 起 眼 。 虽 然 他 已 经 在 网 上 搜索 了 9 
个 月 ,可 还 是 毫 无 结果 。 他 给 几 十 位 OkCupid 网 站 推荐 过 来 的 女士 发 了 邮 
件 , 但 都 石沉大海 。 

麦 金利 在 波士顿 郊区 长 大 ,2001 年 从 明 德 学 院 获 得 了 中 文本 科学 位 ,同年 
8 月 到 纽约 世贸 大 厦 做 翻译 ,五 周 后 世贸 大 楼 倒塌 那天 ,他 因为 提前 下 班 而 躲 

过 了 一 动 。 他 有 点 数学 上 的 小 天 分 ,在 麻 省 理工 学 院 参 加 “决战 21 点 ”时 ,他 一 
年 就 赢 了 6 万 美金 。 眼 下 的 难题 迫使 他 再 次 发 挥 起 自己 的 数学 天 分 。 
为 了 快速 收集 数据 ,他 一 下 子 建 了 12 个 OkCupid 账户 ,编写 了 一 个 
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Python 脚本 ,从 这 些 女士 的 个 人 页 面 上 搜集 所 有 可 能 用 到 的 数据 : 种 族 、 身 
高 .是 否 抽烟 、 星 座 等 。 由 于 只 有 回答 了 别人 的 问题 ,才能 看 到 别人 的 信息 ， 
麦 金利 还 编写 了 一 个 “机 器 人 ”( 自 动 化 程序 ) 来 回答 一 些 简 单 的 问题 ,以 便 获 
取 对 方 的 数据 。 同 时 ,为 了 避免 自己 的 账号 被 爬虫 系统 检测 到 ,他 在 一 位 神 
经 学 家 朋友 山姆 。 托 里 西 (Sam Torrisi) 的 计算 机 上 安装 了 间谍 软件 ,根据 真 
人 在 网 站 的 运动 轨迹 和 数据 来 设计 和 改进 自己 的 “机 器 人 ”。 

这 个 续 密 的 女友 搜索 计划 让 他 在 三 周 内 ,收集 了 来 自 全 美国 2 万 名 女士 
的 600 万 个 问题 。 

这 个 数据 收集 办 法 跟 国 内 的 婚恋 交友 平台 如 世纪 佳缘 、 百 合 网 等 相似 ， 
通过 大 数据 建立 人 物 画 像 , 采 用 聚合 算法 ,神经 网 络 等 手段 , 帮 人 们 寻找 最 可 
能 配对 的 人 。 当 你 在 婚恋 平台 上 更 新 简历 时 ,网 站 后 台 就 会 运用 适当 的 算法 
开始 帮 你 物色 对 象 , 然 后 评 出 分 数 和 匹配 度 。 这 些 结果 都 取决 于 你 曾 如 何 回 
答 相 关 问 题 ,同时 通过 关联 你 的 社交 媒体 账号 并 分 析 你 的 行为 后 所 得 的 数 
据 , 比 如 你 在 微 博 、 微 信 等 社交 媒体 发 布 的 内 容 及 更 新 频率 ,QQ 登录 行为 及 
在 线 时 间 ,更 新 图 片 的 频率 ,作息 时 间 规 律 ,经 常 出 现 的 位 置 等 ,都 会 成 为 分 
析 的 依据 。 通 过 对 这 些 数据 做 出 预测 .匹配 和 推荐 ,系统 就 会 像 亚马逊 .淘宝 
等 网 站 向 你 推荐 你 可 能 喜欢 的 商品 一 样 ,向 你 推荐 你 可 能 会 喜欢 的 人 。 

这 听 起 来 是 不 是 有 点 不 靠 谱 ? 通过 数据 计算 的 结果 , 真 的 能 有 效 匹 配 
吗 ? 要 知道 ,婚恋 网 站 的 匹配 算法 是 理性 推理 的 工具 ,但 人 是 情绪 的 动物 ,也 
常常 被 情绪 奴役 。 加 州 大 学 伯克利 分 校 的 一 项 调查 结果 显示 ,美国 人 只 有 
5% 的 夫妇 是 通过 网 络 认识 的 ,个 性 习惯 相同 对 健康 的 两 性 关系 帮助 并 不 大 。 
另外 ,不 排除 用 户 会 说 谎 , 他 们 的 身高 .体重 ,收入 和 年 龄 等 都 可 能 有 水 分 。 
因此 ,大 数据 建立 起 来 的 模型 有 时 可 能 偏差 很 大 ,需要 进行 信息 修正 和 过 滤 。 
所 以 ,匹配 在 现实 生活 中 并 没有 理论 所 说 的 那样 简单 ,匹配 率 最 高 的 人 不 一 
定 是 最 理想 的 交往 对 象 。 为 了 避免 这 样 的 现象 发 生 , 你 还 需要 再 进行 甄选 的 
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下 5 

所 以 麦 金利 随即 也 开始 了 他 的 甄选 工作 。 首 先 ,他 根据 这 些 女士 的 相似 
性 进行 分 组 。 这 是 他 在 修改 K-Modes 算法 时 得 到 的 灵感 。 这 个 算法 最 早 在 
1998 年 由 贝尔 实验 室 提 出 ,用 于 分 类 和 分 析 生 病 的 豌豆 谷物 。 

通过 多 次 参数 调整 , 麦 金 利根 据 2 万 名 女士 的 回答 将 她 们 分 成 了 7 个 类 
型 。 为 了 验证 这 些 类 型 是 否 全 面 , 麦 金利 又 搜集 了 另外 5000 个 刚刚 在 
OkCupid 上 注册 的 女士 样本 ,这 些 样本 经 过 处 理 也 大 致 分 布 在 这 7 个 类 型 
里 。 看 起 来 这 个 统计 方法 奏效 了 。 

现在 , 麦 金 利 需要 确定 哪个 组 的 女士 对 自己 具有 更 大 的 吸引 力 。 有 一 组 
女士 年 龄 太 小 ,两 组 年 龄 太 大 ,另外 一 组 则 是 虞 诚 的 基督 徒 。 他 还 发 现 有 一 
组 女士 大 多 在 20 多 岁 , 多 数 看 起 来 很 独立 ,有 不 少 从 事 艺术 相关 的 工作 。 还 
有 一 组 女士 看 起 来 也 很 不 错 ,她 们 年 龄 稍 大 ,从 事 编 辑 和 设计 等 有 创造 性 的 
工作 。 麦 金利 决定 在 这 两 组 女士 中 寻找 目标 ,并 将 其 分 为 A 组 和 PB 组。 最 
后 ,他 对 两 组 女士 按照 匹配 率 排 序 ,然后 开始 了 他 的 约会 。 

虽然 有 了 匹配 率 排名 ,可 以 开始 约会 ,但 麦 金利 仍然 面临 着 一 个 难题 。 
假设 麦 金利 有 100 名 潜在 约会 对 象 , 他 一 次 只 能 约会 一 位 女士 。 那 么 他 是 否 

全 部 约会 完 才 能 找到 最 佳 匹 配 呢 ? 麦 金利 永远 无 法 知道 真正 的 缘分 何 

时 到 来 ,他 也 不 知道 下 一 个 约会 的 女士 会 是 什么 样子 ,停止 约会 时 机 实在 很 
难 决定 。 怎 么 办 ? 

数学 家 梅里 尔 . 弗 勒 德 (Merrill Flood) 在 1949 年 提出 了 “未 婚 妻 问 
题 "。 在 这 个 问题 中 ,定义 了 麦 金利 需要 的 决策 方案 : 先 依次 与 部 分 女士 约 
会 ,了 解 自己 究竟 想 要 什么 ,然后 再 从 后 面 的 候选 女士 中 认真 考虑 谁 做 自己 
的 未 婚 妻 ,具体 办 法 就 是 与 比 之 前 见 过 的 那 部 分 女士 都 要 好 的 第 一 个 女士 发 

从 算法 上 说 ,就 是 先 拒 掉 前 面 & 个 人 ,不 管 这 些 人 有 多 好 ;然后 从 第 十 1 
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个 人 开始 ,一旦 看 到 比 之 前 所 有 人 都 要 好 的 人 ,就 毫 不 犹 移 地 选择 她 。 不 难 
看 出 ,的 取 值 很 讲究 , 太 小 了 达 不 到 自我 认 知 的 效果 , 太 大 了 又 会 导致 真正 
可 选 的 余地 不 多 了 。 这 就 变 成 了 一 个 纯 数学 问题 : 在 约会 对 象 总 数 已 知 的 
情况 下 , 当 & 等 于 何 值 时 ,找到 最 佳 匹 配 的 概率 最 大 。 

通过 微 积分 推导 , 麦 金利 预计 约会 者 大 约 有 100 人 ,他 应 该 先 拒绝 掉 前 
37 个 人 (一 100/e,e 之 2.718 为 自然 常数 ) , 静 候 下 一 个 比 这 些 人 都 好 的 人 。 
进一步 的 计算 结果 表明 ,他 最 终 将 找到 真爱 的 几率 同样 是 37%! 当然 ,如 果 
最 理想 的 人 在 前 37% 里 ,那么 错过 前 37 个 约会 对 象 后 ,他 就 再 也 磁 不 到 更 
好 的 人 了 ,因此 ,他 会 有 37% 的 概率 “失败 退场 ”, 或 者 被 迫 选 择 最 后 一 名 约 
会 的 女士 。 同 时 ,我 们 很 容易 算出 ,作为 被 邀约 的 女士 ,最 佳 的 应 约 时 机 是 在 
麦 金利 约会 37 次 以 后 ,作为 第 38 名 约会 对 象 出 现 。 而 且 , 第 100 名 也 是 个 


中 自己 的 概率 至 少 为 37%。 

然而 麦 金 利 的 潜在 约会 对 象 远 远 超过 100 人 。 一 个 多 月 后 , 麦 金利 至 少 
有 了 55 次 约会 。 他 把 每 一 次 约会 的 记录 详细 认真 地 记 在 笔记 本 上 。 约 会 虽 
多 ,但 只 有 三 位 女士 发 展 到 第 二 次 约会 ;只 有 一 位 发 展 到 第 三 次 约会 。 

大 多 数 约会 失败 的 人 都 会 面临 自尊 心 问题 。 麦 金利 也 是 如 此 ,他 其 至 开 
始 怀疑 自己 续 密 的 计算 结果 。 

夏天 快要 结束 的 时 候 , 麦 金利 收 到 了 一 位 叫 克 里 斯 汀 。 王 (Christine 
Wang) 的 28 岁 女 孩 的 留言 。 根 据 麦 金利 的 收集 的 数据 显示 ,这 是 一 位 6 英 
尺 高 的 蓝 眼 睛 女士 ,在 加 州 大 学 洛杉矶 分 校 艺术 专业 学 习 , 他 们 的 匹配 度 
是 91%。 

他 在 学 校 的 雕塑 花园 和 她 见 了 面 ,从 那里 他 们 走 到 了 学 院 的 寿司 店 ,他 
立刻 就 喜欢 上 了 她 。 他 们 一 起 谈论 书籍 艺术 ,音乐 ,他 跟 她 说 了 如 何 通过 精 
心 设计 的 算法 找到 她 的 整个 过 程 。 
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她 说 :“ 我 以 为 黑客 是 忧郁 的 ,愤世嫉俗 的 ,但 你 好 像 有 一 点 不 同 。 我 喜 
欢 这 个 感觉 。” 

这 是 他 们 总 计 88 次 约会 中 的 第 一 次 ,接着 是 第 二 次 、 第 三 次 。 两 个 星期 
后 ,他 们 都 暂停 了 他 们 的 OkCupid 账户 。 

这 是 一 个 关于 匹配 的 故事 。 

也 许 你 会 说 : 天 ,怎么 可 以 用 这 样 冷冰冰 的 数学 公式 来 计算 我 未 来 应 该 
跟 谁 生活 在 一 起 ? 是 的 ,文学 作品 总 会 告诉 你 ,你 爱 的 是 一 个 具体 的 .活生生 
的 人 ,而 不 是 一 系列 指标 的 集合 。 然 而 , 麦 金利 的 故事 并 不 是 否定 人 的 情感 
互动 ,相反 , 它 恰恰 证 明了 在 我 们 存在 的 这 个 世界 中 ,婚姻 并 不 是 一 个 一 春情 
愿 的 市 场 ,而 是 一 个 建立 在 一 系列 条 件 基础 上 的 双向 选择 。 而 如 何 尽 快 解决 
在 相互 选择 过 程 中 的 有 效 性 , 才 是 事情 的 关键 。 就 如 同 诺 贝尔 经 济 学 奖 获得 
者 埃 尔 文 ， 罗 斯 (Alvin E. Roth) 所 说 的 那样 : 我 们 如 何 从 生活 中 得 到 既是 
我 们 所 选择 的 ,同时 也 选择 我 们 的 事物 。 这 个 寻找 人 生 伴 但 的 办 法 ,也 为 我 
们 解决 赛 博 新 经 济 市 场 中 的 供需 问题 提供 了 一 个 新 的 解决 方案 。 


价格 在 赛 博 新 经 济 市 场 的 失灵 


供求 平衡 这 个 概念 从 19 世纪 70 年 代 里 昂 。 瓦 尔 拉 斯 正式 进行 分 析 以 

来 ,一 直 在 经 济 学 中 发 挥 着 核心 作用 ,稀缺 资源 的 分 配 问题 也 是 一 样 。 从 这 
个 意义 上 来 说 ,肾脏 移植 匹配 属于 经 济 学 的 研究 范围 之 内 。 

一 一 坂 并 丰 焉 (合适 》 

20 年 前 ,巴黎 将 地 铁 车 而 分 为 一 等 车 厅 和 二 等 车 厢 , 然 而 ,让 人 们 不 解 

的 是 ,两 种 车 厢 的 座位 数目 和 质量 完全 相同 ,唯一 的 区 别 是 一 等 车 厅 的 价格 
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是 二 等 车 而 的 两 倍 。 这 种 看 似 不 合理 的 定价 机 制 , 却 获得 了 更 高 的 客户 满意 
度 。 这 种 定价 策略 利用 不 同人 群 对 价格 敏感 度 的 不 同 ,通过 设计 不 同 的 产品 
来 匹配 不 同 用 户 的 需求 ,那些 对 价格 敏感 度 低 、 同 时 又 注重 舒适 度 的 乘客 可 
以 选择 相对 宽松 的 一 等 车 而, 价格 敏感 度 高 对 舒适 度 不 敏感 的 乘客 可 以 选择 
相对 拥挤 的 二 等 车 而。 

这 就 是 著名 的 “巴黎 地 铁定 价 ?方案 ,其 背后 的 逻辑 正 是 人 们 对 价格 的 不 
同 敏感 程度 。 大 部 分 的 普通 人 会 选择 便宜 的 二 等 车 厢 , 因 此 ,二 等 车 厢 通 常 
都 是 拥挤 的 。 而 那些 更 注重 舒适 度 的 人 士 ,更 倾向 于 花 更 多 的 钱 进入 相对 宽 
松 的 一 等 车 厢 。 
巴黎 地 铁定 价 ” 是 一 个 典型 的 利用 价格 控制 资源 分 配 的 例子 ,类 似 的 例 
子 还 有 最 近 出 现 的 网 约 专车 的 计价 机 制 。 如 果 我 们 不 考虑 叫 车 平台 对 用 户 
的 补贴 ,那么 通过 专车 平台 叫 到 的 汽车 一 般 会 比 出 租车 贵 ,以 满足 那些 对 品 
质 和 服务 有 要 求 的 客户 。 不 仅 如 此 ,在 用 车 高 峰 时 段 需求 激增 时 ,这 些 公 司 
通常 还 会 采取 动态 提高 价格 的 策略 0。 

在 一 般 的 商品 市 场 中 ,价格 作为 “看 不 见 的 手 ”, 决 定 了 谁 能 得 到 什么 。 
你 可 以 在 成 千 上 万 的 淘宝 店铺 里 为 自己 挑选 产品 ,只 要 你 买 得 起 ,你 就 一 
可 以 得 到 你 想 要 的 东西 。 在 这 里 ,价格 负责 了 一 切 ,你 只 需要 让 自己 变 成 那 
个 “ 买 得 起 ”的 人 。 

然而 ,在 某 些 市 场 里 ,你 会 发 现 钱 并 不 是 万 能 的 ,价格 并 不 能 决定 一 个 人 
得 到 他 想 要 得 到 的 东西 。 这 类 市 场 通常 有 两 个 特点 : 首先 ,价格 对 需求 的 影 
响 是 有 限 的 。 同 样 是 交通 运输 ,将 “巴黎 地 铁定 价 ” 机 制 搬 到 人 口 数量 占据 全 
球 将 近 五 分 之 一 的 中 国 ,动态 调整 价格 带 来 的 惩罚 和 抑制 作用 在 “ 刚 需 ”面前 
很 可 能 失效 。2001 年 至 2007 年 实行 的 春运 火车 票 价格 浮动 非但 没 能 缓解 


Q@ 本 书 第 4 章 会 详细 介绍 动态 定价 的 机 制 和 算法 。 
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春节 出 行 压力 ,反而 带 来 了 更 大 的 社会 矛盾 。 其 次 ,在 某 些 场景 下 ,价格 难以 
发 挥 其 本 来 的 作用 。 例 如 ,名 校 的 就 读 名 额 一 般 情 况 下 是 不 能 出 售 的 。 在 职 
场 中 ,公司 也 不 会 通过 不 断 地 降低 工资 来 寻找 求职 者 ,恰恰 相反 ,公司 会 用 丰 
厚 的 薪资 或 福利 来 吸引 高 水 平 的 人 才 ,并 选择 最 优秀 .最 忠诚 的 员工 。 

因此 ,学生 与 学 校 ,雇主 与 求职 者 之 间 都 存在 双向 选择 的 问题 ,从 而 形成 
一 个 与 传统 商品 市 场 不 同 的 新 型 市 场 , 在 这 个 市 场 中 ,传统 的 市 场 机 制 很 难 
确保 供需 双方 之 间 实 现 更 好 的 匹配 。 高 校 录取 和 劳动 力 市 场 匹 配 实质 上 是 
对 不 可 分 的 离散 资源 (学 生 和 高 校 ,雇主 和 求职 者 ) 进 行 配对 ,就 像 男女 婚姻 
匹配 一 样 ,是 一 个 相互 取悦 对 方 并 做 出 选择 的 双向 匹配 市 场 。 其 实 , 不 只 是 
这 些 , 合 租 .器 官 移植 移动 通信 牌照 和 频段 分 配 等 都 面临 相 类 似 的 匹配 问 
题 ,其 主要 特点 在 于 难以 通过 价格 机 制 实现 市 场 调节 功能 。 

因此 ,在 传统 的 商品 市 场 之 外 ,还 存在 一 种 需要 买 家 与 卖家 之 间 互 动 匹 
配 来 达成 交易 的 新 型 市 场 ,我 们 称 之 为 双向 匹配 市 场 。 在 双向 匹配 市 场 中 ， 
和 品 ( 实 际 上 ,这 里 说 商品 不 太 准 确 ,我 们 暂且 先 用 这 个 词 ) 可 以 按 和 信 们 的 喜 
好 分 配 ,但 是 没有 明确 的 买 入 、 卖 出 或 价格 设 定 。 例 如 ,可 供 移 植 的 肾脏 不 够 
分 配 或 者 最 好 的 学 校 名 额 不 够 时 ,这 些 稀缺 资源 必须 要 通过 遵循 某 种 规则 进 
行 配置 。 

综 上 所 述 ,我 们 发 现 双向 匹配 市 场 有 两 个 重要 的 特征 : 第 一 ,参与 匹配 
的 双方 分 别 属于 两 个 互 不 相交 的 集合 , 且 位 置 不 能 互 换 。 例 如 ,高 考 志 愿 填 
报 中 ,学 生 和 高 校 已 确定 且 无 法 互 换 。 第 二 ,只 有 经 过 双方 一 致 同意 后 ,才能 
形成 匹配 , 即 匹配 是 双向 的 。 在 男女 婚姻 中 ,落花 有 意 流 水 无 情 往往 无 法 修 
成 正果 。 同 样 ,再 好 的 大 学 也 不 可 能 招 到 所 有 优秀 的 学 生 , 还 需要 这 些 学 生 
也 正好 选择 了 这 些 学 校 。 劳 动力 市 场 亦 是 如 此 ,这 里 ,我 们 暂 不 考虑 求职 者 
自主 创业 进一步 成 为 雇主 的 可 能 性 , 即 求职 者 和 雇主 这 两 个 集合 不 存在 


交集 。 
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在 传统 的 商品 市 场 中 ,价格 是 亚当 ' 斯 密 所 说 的 “看 不 见 的 手 ”。 而 在 匹 
配 市 场 中 , 面 对 价 格 的 失灵 ,让 买方 和 卖方 可 以 找到 对 方 的 匹配 算法 就 发 挥 
了 其 重要 的 作用 。 针 对 不 同 的 匹配 需求 ,市 场 设 计 有 不 同 的 侧重 点 ,有 的 追 
求 稳定 匹配 , 即 双 方 都 不 可 能 在 这 个 市 场 中 找到 更 好 的 选择 ,有 的 追求 最 大 
匹配 , 即 在 市 场 中 能 够 达到 匹配 的 参与 者 数量 最 大 ,相应 地 ,我 们 也 将 使 用 不 
同 的 匹配 算法 , 即 稳 定 匹 配 算法 和 最 大 匹配 算法 。 下 面 我 们 就 以 这 两 种 算法 
的 典型 应 用 来 介绍 它们 如 何在 市 场 中 发 挥 作用 。 


Gale-Shapley 匹配 算法 : 一 种 更 为 稳定 的 匹配 设计 


男女 关系 方面 ,社会 就 那么 多 资源 ,基本 上 会 趋向 公平 合理 的 分 配 ,只 
很 少 一 部 分 人 会 投机 成 功 , 最 终 , 多 数 人 还 是 会 找到 合适 的 ,如 果 自 己 觉得 不 
合适 , 那 是 自我 认 知 有 问题 一 一 大 家 都 想 找 比 自身 条 件 更 高 一 级 的 ,不 过 最 
后 总 会 落 到 同等 水 平 的 人 手 里 ,自由 在 哪里 ? 我 认为 是 向 低 一 档 的 人 群 
里 找 。 

一 一 石 康 , 作 家 


自己 喜欢 的 人 恰好 也 喜欢 自己 ,然后 共 结 连理 ,这 大 概 是 最 理想 的 婚姻 
了 。 不 过 人 生 总 是 如 此 艰难 , 沙 花 有 意 流水 无 情 才 是 经 常 上 演 的 戏码 。 然 
而 ,这 并 不 是 最 悲 俊 的 ,如 果 婚 后 才 发 觉 遇 到 了 真爱 ,恐怕 才 是 悲剧 的 开始 。 
一 个 稳定 的 婚姻 应 该 是 建立 在 双方 都 遵守 婚姻 规则 的 基础 上 ,彼此 都 能 够 主 
动 或 被 动 地 避免 出 轨 行 为 。 通 俗 地 说 ,在 婚姻 内 ,如 果 “ 我 爱 的 人 也 爱 我 ”或 
者 “我 爱 的 人 不 爱 我 , 爱 我 的 人 我 不 爱 ”, 都 可 以 形成 稳定 的 婚姻 。 
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也 许 这 会 让 一 些 人 听 起 来 不 太 和 舒服 ,毕竟 在 他 们 的 价值 观 里 ,爱情 或 婚 
姻 中 的 精神 与 肉体 双重 统一 是 他 们 一 直 以 来 的 信仰 ,但 是 我 们 如 果 以 结果 为 
判断 依据 时 ,就 会 发 现 事实 的 确 如 此 。 
如 图 3. 1 所 示 , 比 如 说 李 先 生 和 孙女 
士 婚 后 , 李 先 生 虽然 又 喜欢 肖 女 士 ,但 
肖 女 士 并 不 认为 李 先 生 与 自己 合拍 ， 
她 喜欢 的 还 是 王 先生 ,那么 李 先 生 和 
孙女 士 的 婚姻 关系 就 会 处 在 相对 稳定 
的 状态 ,这 时 我 们 才能 说 这 个 匹配 是 
有 效 的 。 也 许 社会 学 或 者 心理 学 家 会 
给 你 许多 有 关 匹 配 的 思考 和 哲学 , 然 
而 罗 伊 德 . 沙 普 利 (Lloyd Shapley) 和 
戴 维 ' 盖 尔 (David Gale) 却 用 算法 来 告诉 你 一 个 可 以 具体 操作 的 办 法 , 那 就 

是 他 们 提出 的 Gale-Shapley 匹配 算法 。 


李 先 生 全 ** “Qs 孙女 士 
* 


a a 


图 31 稳定 的 婚姻 匹配 


Gale-Shapley 匹配 算法 


匹配 算法 的 灵感 最 初 来 源 于 一 封 如 何 选 择 室友 的 信件 。 罗 伊 德 。 沙 普 
利 收 到 普林斯顿 的 同班 同学 之 一 、 加 州 大 学 伯克利 分 校 教 授 戴 维 。 盖 尔 
(David Gale) 的 一 封 信 , 他 提出 了 选择 室友 的 问题 : 如 果 有 两 组 人 ,每 个 人 都 
有 不 同 的 偏好 ,是 否 有 方法 产生 一 个 将 两 组 人 配对 的 稳定 解 ? 盖 尔 起 初 认为 
没有 方法 可 以 产生 一 个 稳定 解 , 然 而 当 沙 普 利 试图 证 明 这 个 结论 的 时 候 , 却 
意外 地 发 现 这 个 问题 存在 稳定 解 ! 后 来 ,他 与 盖 尔 将 这 个 算法 写成 了 一 篇 名 
为 “大 学 招生 和 婚姻 稳定 ”的 论文 ,发 表 在 1962 年 的 (美国 数学 月 刊 》 上 。 这 
就 是 著名 的 Gale-Shapley 匹配 算法 。 然 而 ,他 们 的 论文 最 初 并 未 被 评审 人 接 
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受 , 它 被 诉 病 的 地 方 是 一 篇 数学 论文 竟然 没有 和 包含 任何 数学 方程 。 对 此 他 们 
在 论文 中 是 这 样 解释 的 : 

“推导 过 程 没有 了 睡 涩 的 缮 灌 或 技术 术语 ,我 们 只 通过 通俗 的 语言 代替 数 
学 符号 来 描述 算法 ,因此 并 不 需要 微 积 分 的 知识 作为 前 提 。 实 际 上 ,一 个 人 
只 要 会 计数 就 可 以 。 然 而 任何 一 个 数学 家 很 快 就 能 意识 到 这 的 确 是 数学 
推导 。” 

这 个 天 才 的 算法 后 来 被 哈佛 大 学 商学 院 教授 埃 尔 文 。 罗 斯 (Alvin EE. 
Roth) 发 扬 光 大 ,他 在 Gale-Shapley 机 制 的 基础 上 ,开发 了 一 种 实用 算法 ,并 
将 其 应 用 在 了 很 多 领域 ,比如 美国 的 住院 医师 、 职 业 劳 动 市 场 ,以 及 纽约 和 波 
士 顿 的 公立 学 校 招生 等 。 这 极 大 地 推动 了 Gale-Shapley 匹配 算法 的 应 用 和 
发 展 。 

2012 年 ,瑞典 皇家 科学 院 将 该 年 度 诺 贝尔 经 济 学 奖 授予 了 罗斯 与 沙 普 利 ， 
以 此 嘉奖 两 位 学 者 在 稳定 分 配 理论 及 其 市 场 设计 实践 方面 的 成 就 。 瑞 典 皇 家 
科学 院 陈述 两 位 教授 获奖 理由 为 :“ 稳 定 分 配 一 一 由 理论 走向 实际 ?。 正 如 前 
面 所 说 , 沙 普 利 是 理论 的 先驱 ,而 罗斯 则 是 一 个 实践 者 。 遗 憾 的 是 盖 尔 教授 于 
2008 年 汪 然 长 逝 , 不 然 他 一 定 会 与 沙 普 利 分 享 诺 贝尔 奖 的 党 高 荣誉 。 

经 典 的 Gale-Shapley 匹配 算法 (后 面 简称 为 Gale-Shapley 算法 ) 是 一 个 
迭代 算法 : 第 一 步 ,每 个 单身 男士 在 所 有 没有 拒绝 他 的 女士 中 选择 最 喜欢 的 
求婚 ;第 二 步 , 每 个 女士 在 所 有 向 自己 示爱 的 男士 中 选择 最 喜欢 的 作为 男友 。 
如 此 和 迭代 ,直到 每 一 位 男士 要 么 牵手 一 位 女士 ,要 么 被 所 有 女士 拒绝 。 注 意 ， 
这 里 面 有 一 个 假设 的 前 提 条 件 是 ,被 拒绝 一 方 不 会 继续 执着 地 追求 对 方 , 虽 
然 实 际 情况 往往 不 会 如 此 (抱歉 在 使 用 数学 方法 时 ,我 们 总 是 需要 很 多 
理性 !)。 

假设 有 4 男 4 女 , 男 女 双 方 都 有 一 个 偏好 列表 。 例 如 ,1 号 男士 对 女士 
的 偏好 依次 为 3 号 女士 .4 号 女士 .2 号 女士 和 1 号 女士 。 同样, 每 位 女士 也 
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对 男士 们 有 一 个 偏好 列表 。 每 位 男士 都 向 最 心仪 的 女士 发 起 攻势 ,向 她 表 
。 女 士 将 面 对 三 种 情况 : 有 不 止 一 个 人 跟 她 表白 ;只 有 一 个 人 跟 她 表白 ; 
没有 人 跟 她 表白 。 这 三 种 情况 对 应 的 选择 分 别 是 : 选择 最 优选 的 那 一 位 , 答 
应 与 他 暂时 配对 ;接受 表白 ,暂时 与 其 配对 ;继续 等 待 。 当 此 轮 选 择 结 束 后 ， 
男女 均 有 一 部 分 已 完成 配对 , 剩 下 的 继续 保持 单身 。 如 图 3. 2 所 示 , 在 第 一 
轮 中 ,1 号 男士 和 2 号 男士 同时 向 3 号 女士 表白 ,但 是 假设 3 号 女士 更 喜欢 1 
号 男士 (女方 的 偏好 在 图 中 未 列 出 来 ) ,因此 ,2 号 男士 会 被 拒绝 ,在 这 一 轮 结 
束 后 ,2 号 男士 仍然 是 


AT 


TT 
"Ts 


图 32 男士 偏好 列表 示例 第 一 轮 表 白 ) 


只 要 匹配 没有 最 终 完成 ,这 个 过 程 就 会 继续 ,在 新 一 轮 中 ,每 位 未 配对 男 

士 都 像 前 一 轮 一 样 ,女士 们 则 需要 从 表白 者 中 选择 最 中 意 的 一 位 ,拒绝 其 他 

追求 者 。 因 此 ,如 图 3. 3 所 示 , 在 第 二 轮 迭 代 中 ,2 号 女士 为 2 号 男士 的 第 二 

选择 , 且 在 此 前 没有 拒绝 过 2 号 男士 , 故 2 号 男士 直接 向 2 号 女士 表白 。 而 

在 2 号 女士 的 排序 中 2 号 男士 优 于 4 号 男士 ,因此 2 号 女士 必须 拒绝 4 号 男 
士 ,与 2 号 男士 配对 。4 号 男士 重新 成 为 单身 。 

继续 上 述 过 程 , 如 图 3.4 所 示 ,4 号 男士 选择 向 4 号 女士 表白 ,而 由 于 4 

号 女士 一 直 处 于 等 待 状态 ,她 会 接受 配对 ,于 是 配对 稳定 下 来 。 男 士 拥有 主 
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动 选择 权 , 但 是 男士 经 过 一 轮 一 轮 筛选 ,追求 对 象 却 越 来 越 差 ,女士 虽 被 动 ， 
却 可 以 得 到 相对 更 好 的 选择 。 配 对 完成 后 ,男女 双方 均 得 到 规则 下 相对 最 好 
的 选择 ,成 为 稳定 配对 ,如 图 3.5 所 示 。 


图 33 第 二 轮 迭 代 


34 第 三 轮 迭 代 


91 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


35 最 终 配 对 结果 


这 个 世界 存在 稳定 匹配 吗 


也 许 有 人 会 质疑 Gale-Shapley 算法 的 有 效 性 ,这 个 如 此 简单 的 算法 是 如 
何 解决 稳定 性 问题 的 ? 为 了 解答 这 个 疑问 ,首先 我 们 需要 达成 共识 , 即 互相 
选择 的 双方 在 数量 相等 的 情况 下 ,最终 将 全 部 完成 互相 配对 ,不 会 有 人 落下 。 
在 这 个 前 提 条 件 下 ,Gale-Shapley 算法 得 到 的 匹配 结果 如 何 确保 是 稳定 匹配 
呢 ? 究竟 还 有 没有 不 稳定 因素 呢 ? 我 们 用 下 面 的 逻辑 进行 一 个 简单 推理 : 

假设 匹配 结果 中 存在 不 稳定 因素 。 有 一 男 一 女 ,分 别 是 M 和 W, 他 们 各 
自 都 已 经 有 了 伴侣 ,但 是 M 喜欢 W 胜 过 他 现在 的 伴侣 ,同样 , W 也 喜欢 M 
胜 过 她 现在 的 伴侣 。 但 是 根据 算法 规则 ,M 肯定 是 向 W 求 过 婚 的 ,如 果 W 
更 喜欢 M,W 应 该 选择 M 而 不 是 当前 的 伴侣 ,所 以 这 个 假设 不 会 成 立 , 也 就 
是 说 ,这 种 不 稳定 的 因素 并 不 会 发 生 。 

可 见 ,Gale-Shapley 算法 迭代 的 结果 最 终 一 定 会 达到 一 个 稳定 均衡 点 。 
这 个 均衡 点 就 是 一 个 稳定 匹配 ,使 得 任何 一 对 配对 的 男女 没有 动力 背叛 对 
方 , 这 相当 于 非 合作 博弈 中 的 纳什 均衡 。 

虽然 大 部 分 被 歌颂 的 爱情 都 在 标榜 执着 地 追求 命中 注定 的 唯一 ,但 在 匹 
配 理论 中 ,稳定 的 匹配 , 即 “ 对 的 人 ”并 不 是 唯一 的 ,而 且 稳 定 的 匹配 也 不 代表 每 
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个 人 都 能 得 到 自己 最 梦 嘛 以 求 的 人 ,甚至 在 一 个 稳定 匹配 中 ,没有 人 能 够 与 

喜欢 的 人 在 一 起 。 赛 博 新 经 济 市 场 的 匹配 也 是 如 此 。 这 听 起 来 或 许 令 人 
诅 丧 , 但 这 并 不 代表 你 应 该 放弃 执着 地 追求 。 相 反 , 你 会 从 中 发 现 主动 与 被 动 
地 去 参与 匹配 会 得 到 不 同 的 结果 。 这 就 是 匹配 算法 常 提 到 的 两 个 策略 , 即 “ 男 
士 优先 ”还 是 “女士 优先 ”, 这 两 种 策略 导致 的 结果 可 能 有 天 壤 之 别 。 也 就 是 说 ， 
Gale-Shapley 算法 并 不 是 对 称 的 。 前 者 男士 占据 主动 : 如 果 还 存在 其 他 的 稳定 
匹配 ,那么 里 面 任何 一 个 男士 的 华 倡 排 名 都 不 会 比 “ 男 士 优先 ”得 到 的 结果 更 
好 ,我 们 说 此 种 情况 每 个 男士 获得 的 是 “最 好 ”的 伴 但。 此 时 女士 只 能 被 动 地 一 
步 步 接近 她 最 爱 的 目标 , 也 许 最 终 往往 碰 不 到 ,结果 是 : 如 果 还 存在 其 他 的 稳 
定 匹 配 ,那么 里 面 任何 一 个 女士 的 伴侣 排名 都 不 会 比 * 男 士 优先 ”得 到 的 结果 更 
差 ,我 们 说 此 种 情况 每 个 女士 获得 的 是 “最 差 ”的 伴侣 。 第 二 种 情况 恰好 相反 。 
在 匹配 问题 中 ,这 种 现象 称 为 “利益 的 对 立 ”(Opposition of Interests) 。 盖 尔 在 
1985 年 进一步 证 明了 :“ 所 有 的 双边 匹配 问题 中 ,双方 必定 存在 利益 的 冲突 ”。 
这 种 利益 冲突 会 导致 在 婚姻 中 双方 不 会 拥有 同等 的 满意 度 。 所 以 ,匹配 算法 
也 会 用 数学 的 方法 告诉 你 ,主动 追求 幸福 的 人 ,会 更 加 接近 幸福 ;主动 参与 选择 
的 人 ,更 可 能 得 到 对 自己 最 有 利 的 匹配 结果 。 


匈牙利 算法 : 一 支 最 大 匹配 的 丘比特 之 箭 


在 黄石 谷 谈 得 来 ,不 一 定 在 费城 也 谈 得 投机 ,在 大 城市 中 ,有 着 太 多 转移 
我 们 心思 的 因素 ,我 老 党 得 一 男 一 女 流落 在 荒 岛 上 ,立刻 可 以 结合 , 因 没 有 选 
择 的 缘故 。 在 城 里 ,有 选择 的 时 候 , 男 女 间 感 情 发 展 往往 是 比较 缓慢 的 。 
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当然 ,在 匹配 市 场 里 ,并 不 是 所 有 的 匹配 都 是 以 解决 稳定 性 为 首要 目标 ， 
有 时 候 , 相 比 稳定 性 ,市 场 双方 更 追求 最 大 化 地 实现 配对 ,因此 在 经 典 的 
Gale-Shapley 算法 基础 上 ,出 现 了 针对 这 一 匹配 目标 的 匹配 算法 。 我 们 上 
“丘比特 的 烦恼 ”为 例 来 介绍 ,这 是 2010 年 国际 信息 学 奥林匹克 竞赛 中 国 队 
选拔 赛 (China Team Selection Competition ,CTSC) 中 的 一 道 题目 。 


丘比特 的 烦恼 


随 着 社会 的 不 断 发 展 ,人 与 人 之 间 的 感情 越 来 越 功 利 化 。 最 近 , 爱 神 下 
比特 发 现 ,爱情 也 已 不 再 是 完全 纯洁 的 了 。 
这 使 得 丘比特 很 是 苦恼 ( 见 图 3. 6) ,他 越 来 人 
越 难 找到 合适 的 男女 ,并 向 他 们 射 去 丰 比 让 D 2 
特 之 箭 。 于 是 丘比特 千里 退 喜 远 赴 中 国 ， / 人 
找到 了 掌管 东方 人 爱情 的 神 一 月 下 老 
人 ,向 他 求教 。 4 

月 下 老人 告诉 丘比特 ,纯洁 的 爱情 并 
不 是 不 存在 ,而 是 他 没有 找到 。 在 东方 ,人 
们 讲究 的 是 缘分 。 月 下 老人 只 要 做 好 一 男 一 女 两 个 泥人 ,在 他 们 之 间 连 上 一 
条 红线 ,那么 它们 所 代表 的 人 就 会 相爱 一 一 无 论 他 们 身 处 何 地 。 而 详 比 特 的 
爱情 之 箭 只 能 射 中 两 个 距离 相当 近 的 人 ,选择 的 范围 自然 就 小 了 很 多 ,不 能 
找到 真正 的 有 缘 人 。 

丘比特 听 了 月 下 老人 的 解释 , 芭 塞 顿 开 ,回去 之 后 用 了 人 间 的 最 新 科技 
改造 了 自己 的 可 箭 , 使 得 丘比特 之 箭 的 射程 大 大 增加 。 这 样 , 射 中 有 缘 人 的 
机 会 也 增加 了 不 少 。 

情人 节 (Valentine's day) 的 午夜 零 时 ,丘比特 开始 了 自己 的 工作 。 他 选 


图 36 丘比特 的 烦恼 
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择 了 一 组 数目 相等 的 男女 ,感觉 到 他 们 互相 之 间 的 缘分 大 小 ,并 依 此 射出 了 
神 箭 ,使 他 们 产生 爱 意 。 他 希望 能 选择 最 好 的 方法 ,使 他 所 选择 的 每 一 个 人 
被 射 中 一 次 , 且 每 一 对 被 射 中 的 人 之 间 的 缘分 之 和 最 大 。 

当然 ,无 论 堪 比 特 怎么 改造 自己 的 弓箭 ,总 还 是 存在 缺陷 的 。 首 先 , 弓 血 
的 射程 尽管 增 大 了 ,但 毕竟 还 是 有 限 的 ,不 能 像 月 下 老人 那样 ,做 到 “千里 姻 
缘 一 线 率 ”。 其 次 ,无 论 怎么 改造 , 箭 的 轨迹 终归 只 能 是 一 条 直线 ,也 就 是 说 ， 
如 果 两 个 人 之 间 的 连 线段 上 有 别人 ,那么 就 不 能 向 他 们 射出 丘比特 之 箭 ,和 否 
则 , 按 月 下 老人 的 话 ,就 是 “ 乱 点 轰 奢 谱 ” 了 

“作为 一 个 凡人 ,你 的 任务 是 运用 先进 的 计算 机 为 自 比 特 找到 最 佳 的 

这 里 ,CTSC 让 大 家 运用 的 计算 机 方法 其 实 就 是 一 个 有 关 匹 配 的 算法 。 

这 个 问题 与 经 典 Gale-Shapley 稳定 婚姻 问题 有 所 区 别 : 

首先 , 马 箭 的 射程 有 限 。 所 以 某 一 男士 只 能 在 有 限 的 范围 内 寻找 自己 的 
伴侣 ,不 可 能 像 在 稳定 婚姻 问题 里 那样 ,可 以 在 所 有 女士 范围 内 选择 。 

其 次 是 匹配 的 目标 不 同 。 丘 比特 的 目标 是 找到 缘分 值 之 和 最 大 的 匹配 ， 
而 稳定 婚姻 追求 的 是 匹配 的 稳定 性 。 可 以 说 ,稳定 婚姻 匹配 是 发 散 的 ,具有 
博弈 的 特性 ,而 “丘比特 之 箭 ” 是 集中 式 的 控制 。 

稳定 婚姻 可 以 采用 Gale-Shapley 算法 来 解 。 而 丘比特 的 烦恼 则 需要 新 
的 匹配 算法 来 解决 。 首 先 ,我 们 假设 男女 之 间 缘 分 值 是 没有 区 别 的 ,那么 该 
问题 就 变 成 了 最 简单 的 最 大 匹配 问题 。 也 就 是 一 个 二 分 图 最 大 权 匹 配 问题 。 

二 分 图 指 的 是 这 样 一 种 图 ,所 有 的 边 都 在 图 的 两 个 节点 集合 之 间 , 而 两 个 节 
点 集合 内 部 没有 边 。 那 么 ,我 们 需要 做 的 就 是 尽 可 能 地 为 最 多 的 节点 实现 配 
对 ,寻找 二 分 图 的 最 大 匹配 一 般 采 用 的 是 匈牙利 算法 。 
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匈牙利 算法 


匈牙利 算法 由 匈牙利 数学 家 Edmonds 于 1965 年 提出 ,因而 得 名 。 如 
图 3.7 所 示 , 假 设 有 4 个 剩 男 ( 左 ),4 个 剩女 
右 ), 每 个 人 都 可 能 对 多 名 异性 有 好 感 。 如 果 一 
对 男女 互 有 好 感 ,那么 就 可 以 把 这 一 对 撮合 在 一 
起 。 在 图 3.7 所 示 的 好 感 关系 图 中 ,每 一 条 黑色 
实 线 都 表示 互 有 好 感 。 匈 牙 利 算法 就 是 尽 可 能 地 
气 合 更 多 的 情侣 ,也 就 是 实现 二 分 图 的 最 大 匹配 。 

第 一 步 : 先 试 着 给 1 号 男士 找 女 士 , 发 现 第 
一 个 与 他 相连 的 1 号 女士 还 单身 ,此 时 , 连 上 一 条 红线 ,如 图 3.8 所 示 。 

第 二 步 : 接着 给 2 号 男士 找 女士 ,发 现 第 一 个 与 他 相连 的 2 号 女士 也 单 
身 , 同 样 , 连 上 一 条 红线 ,如 图 3. 9 所 示 。 


一 


图 37 好 感 关系 图 


图 38 匹配 1 号 男士 图 39 匹配 2 号 男士 
第 三 步 : 接 下 来 是 3 号 男士 ,很 遗憾 1 号 女士 已 经 有 主 了 ,怎么 办 呢 ? 


我 们 试 着 给 之 前 1 号 女士 匹配 的 男士 (也 就 是 1 号 男士 ) 另 外 分 配 一 个 女士 
虚线 表示 ,说 明 这 条 边 被 临时 拆 掉 ) ,如 图 3. 10 所 示 。 


一 
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与 1 号 男生 相连 的 第 二 个 女士 是 2 号 女士 ,但 是 不 巧 的 是 2 号 女士 也 有 
对 象 了 ,怎么 办 呢 ? 我 们 再 试 着 给 2 号 女士 的 原配 (2 号 男士 ) 重 新 找 一 位 女 
士 (注意 这 个 步骤 与 上 面 是 一 样 的 ,也 是 一 个 递归 的 过 程 ) ,如 图 3. 11 所 示 。 


图 310 拆散 1 号 男士 与 1 号 女士 图 31f 拆散 2 号 男士 与 2 号 女士 


此 时 发 现 2 号 男士 还 能 找到 4 号 女士 ,那么 之 前 的 问题 迎刃而解 了 ， 

回溯 回去 。2 号 男士 可 以 与 4 号 女士 配对 (如 图 3. 12 所 示 ) ,1 号 男士 可 以 

2 号 女士 配对 (如 图 3. 13 所 示 ),3 号 男士 可 以 与 1 号 女士 配对 (如 
图 3.14 所 示 )。 


图 312 重新 匹配 2 号 男士 图 313 重新 匹配 1 号 男士 


所 以 第 三 步 最 后 的 结果 如 图 3. 15 所 示 。 
第 四 步 : 接 下 来 是 4 号 男生 ,很 遗憾 ,按照 第 三 步 的 匹配 结果 ,我 们 没 法 
给 4 号 男生 找到 一 位 合适 的 女士 。 这 就 是 匈牙利 算法 的 流程 ,可 以 看 出 ,其 


97 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


中 找 女士 是 个 递归 的 过 程 。 


图 314 匹配 3 号 男士 图 315 匹配 结果 


然而 ,丘比特 的 目标 是 找到 缘分 值 之 和 最 大 的 匹配 。 也 就 是 说 ,匹配 对 
象 之 间 带 了 权 值 ,这 称 为 最 大 权 匹 配 问题 。 这 里 ,“ 丘 比特 之 箭 ” 称 为 KM 算 
法 。KM 算法 是 匈牙利 算法 的 扩展 ,是 解决 匹配 市 场 中 二 分 图 匹配 的 另 一 类 
经 典 算法 。 

KM 算法 就 是 换个 角度 看 二 分 图 的 最 大 匹配 , 即 二 分 图 的 每 条 边 的 默认 
权重 为 1, 所 求 二 分 图 的 最 大 匹配 权重 自然 是 最 大 的 。 而 对 于 带 权 二 分 图 ， 
其 边 有 大 于 0 的 权重 ,我 们 需要 找到 一 组 匹配 ,使 全 部 匹配 边 的 权重 之 和 最 
大 ,这 就 是 带 权 二 分 图 的 最 佳 匹 配 。 


如 何 从 多 对 一 的 匹配 中 获得 最 佳 选择 


人 生 是 一 场 负重 的 狂奔 ,需要 不 停 地 在 每 一 个 岔路 口 做 出 选择 。 而 每 一 
个 选择 ,都 将 通 往 另 一 条 截然 不 同 的 命运 之 路 。 


沧 月 ,当代 奇幻 文学 作家 
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在 婚姻 匹配 中 ,我 们 考虑 的 男女 双方 匹配 结果 是 一 对 一 的 (一 夫 一 妻 的 
婚姻 制度 ) 。 但 有 时 匹配 结果 是 多 对 一 的 ,比如 高 考 招生 和 公司 招聘 ,多 个 学 
生 可 以 分 配 到 同一 所 学 校 就 读 ,多 个 求职 者 也 可 能 申请 到 同一 个 公司 就 职 。 

多 对 一 的 关系 , 听 上 去 对 考生 和 求职 者 很 不 利 。 但 事实 上 ,如 前 面 所 说 ， 
这 是 一 个 双向 匹配 市 场 ,只 有 学 生 和 求职 者 先 做 出 选择 , 才 会 被 选择 。 这 样 
的 多 对 一 双向 匹配 市 场 情 况 比 一 对 一 更 为 复杂 ,如 果 把 握 不 好 ,很 可 能 得 到 
最 差 选项 。 例 如 ,在 高 考 后 ,我们 经 常会 发 现 * 高 分 低 就 ”的 现象 , 即 考 了 高 分 
却 只 收 到 低 录取 分 数 院 校 的 录取 通知 书 。 打 个 比方 说 ,小 高 是 2013 理科 考 
生 , 高 考 总 分 523 分 ,超过 一 本 线 74 分 ,但 是 他 却 只 收 到 了 最 后 一 个 志愿 南 
华 大 学 的 录取 通知 (如 表 5. 1 所 示 )。 


表 5.1 小 高 的 志愿 填报 表 


平行 志愿 报考 院 校 2013 年 录取 最 低 分 报考 策略 
第 1 志愿 华南 理工 大 学 563 冲刺 
第 2 志愿 兰州 大 学 526 稳当 
第 3 志愿 首都 经 济 贸 易 大 学 525 稳当 
第 4 志愿 南方 医科 大 学 524 稳当 
第 5 志愿 南华 大 学 462 保底 
之 所 以 产生 这 个 问题 ,有 两 个 原因 : 首先 ,信息 不 对 称 。 在 选择 院 校 时 ， 


人 们 往往 只 是 基于 往年 录取 的 最 低 分 数 线 来 选择 学 校 。 然 而 ,如 果 情 况 发 生 
变化 ,就 会 使 判断 产生 重大 偏差 ,产生 如 同上 面 例子 中 所 看 到 的 现象 : 第 1 
志愿 华南 理工 大 学 自 2009 年 以 来 录取 分 数 线 每 年 分 别 超 过 一 本 线 73、85、 
100 和 113 分 ,而 且 呈 现 逐 年 上 涨 的 趋势 ,指望 该 校 大 幅 降 分 录取 很 不 现实 ， 
如 果 分 数 不 够 ,只 能 寄 希 望 于 第 2.3 .4 志愿 。 而 小 高 第 2.3、4 志愿 选择 了 比 
华南 理工 低 一 个 档次 的 相同 水 平 院 校 ,按理 说 这 是 合适 的 ,但 问题 在 于 不 能 
精准 地 预测 院 校 录取 分 数 ,只 是 赁 往年 的 排名 和 录取 最 低 分 判断 ,三 所 院 校 
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均 仅 仅 差 几 分 而 遗憾 没有 被 投档 。 小 高 用 南华 大 学 作为 保底 志愿 ,从 最 终结 
果 来 看 ,虽然 确实 保证 了 顺利 录取 ,但 是 他 本 来 可 以 去 更 好 一 些 的 学 校 。 其 
次 ,对 平行 志愿 机 制 下 的 匹配 算法 缺乏 了 解 , 即 平行 志愿 "不 平行 “后面 会 分 
析 到 ) 。 如 果 小 高 的 志愿 填报 能 够 避免 以 上 两 个 问题 ,完全 可 以 “高 分 高 就 ”， 
进入 更 好 一 些 的 院 校 , 比 如 广东 外 语 外 贸 大 学 (录取 最 低 分 516 分 ) .深圳 大 
学 (录取 最 低 分 518 分 ) 和 南京 财经 大 学 (录取 最 低 分 519 分 ) 等 。 


知 分 不 如 估 分 : 个 体 理 性 下 的 集体 非 理性 


学 生 填 报 志愿 是 完成 学 生 与 高 校 之 间 匹 配 的 第 一 步 , 然 而 在 中 国 ,填报 
志愿 方式 呈现 出 多 样 化 的 特征 。 自 1977 年 恢复 高 考 以 来 ,中 国 高 考 志愿 填 
报 方式 经 历 了 考 前 填报 志愿 、 考 后 估 分 填报 、 考 后 知 分 填报 三 个 阶段 。 如 何 
更 好 地 将 学 生 与 高 校 匹配 一 直 是 一 个 难题 。 

最 初 , 考 生 先 根 据 自 己 的 兴趣 和 平时 学 习 成 绩 填报 志愿 ,然后 参加 高 考 ， 
高 校 根据 高 考 成 绩 进行 录取 ,这 就 是 考 前 填报 志愿 。 然 而 , 随 着 考生 人 数 的 
不 断 增 加 ,为 了 提高 匹配 的 合理 性 ,部 分 省 市 开始 实行 考 后 估 分 填报 志愿 , 考 
生 先 参加 高 考 ,根据 估算 出 来 的 分 数 填报 志愿 ,高校 根据 高 考 成 绩 进行 录取 。 
大 约 到 了 21 世纪 初 ,大 家 发 现 高 考 前 和 高 考 后 估 分 填报 志愿 的 方式 ,反而 加 
大 了 考生 的 落榜 风险 。 于 是 一 些 省 市 让 考生 先 参加 高 考 ,等 分 数 出 来 后 再 填 
最 初 仅 在 个 别 省 市 推行 ,如 今 已 被 我 国 大 部 分 省 市 采用 。 长 期 坚持 高 考 前 填 
志愿 的 上 海 市 也 于 2017 年 改 为 了 高 考 后 知 分 填报 志愿 。 

虽然 知 分 填报 志愿 有 利于 考生 选择 学 校 ,避免 估 分 填报 的 盲目 性 ,然而 
在 实际 操作 过 程 中 却 常常 会 出 现 各 批 次 竞争 加 剧 , 反 而 更 容易 造成 高 分 考 
落榜 的 现象 。 这 个 现象 的 产生 完全 符合 经 济 学 中 著名 的 悖 论 “ 因 徒 困 境 ”。 
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“ 因 徒 困境 ”是 1950 年 美国 兰 德 公司 的 梅里 尔 。 弗 勤 德 (Merrill Flood) 
和 梅 尔 文 。 德 雷 希 尔 (Melvin Dresher) 提 出 的 ,后 来 由 顾问 艾 伯 特 。 塔 克 
(Albert Tucker) 以 因 徒 方式 阐述 ,并 命名 为 “囚徒 困境 ”"。 两 个 共 谋 犯罪 的 人 
被 关 入 监狱 并 被 独立 审讯 ,不 能 互相 沟通 情况 。 检 察 官 向 两 人 宣布 如 下 规 
则 ,如 果 两 个 人 都 不 揭发 对 方 ,由 于 证 据 不 确定 ,每 个 人 都 将 判刑 一 年 ; 若 一 
人 揭发 ,而 另 一 人 沉默 , 则 揭发 者 因为 立功 而 立即 获释 ,沉默 者 因 不 合作 将 判 
刑 五 年 ; 若 互 相 揭 发 , 则 因 证 据 确实 ,二 者 都 判刑 两 年 。 由 于 囚徒 无 法 确定 另 
外 一 人 会 采取 何 种 策略 ,因此 倾向 于 互相 揭发 ,而 不 是 同 守 沉 默 。 最 终结 果 
是 两 人 都 判刑 两 年 ,而 明显 更 好 的 两 人 共同 沉默 的 结果 则 无 法 实现 。 因 徒 困 
境 所 反映 出 的 深刻 问题 是 ,人 类 的 个 人 理性 有 时 会 导致 集体 的 非 理 性 一 一 聪 
明 的 人 类 会 因 自 己 的 聪明 而 作 茧 自 缚 。 

本 来 ,在 考 前 填报 志愿 和 考 后 估 分 填 志愿 时 ,考生 参考 平时 成 绩 , 填 报时 
往往 比较 谨慎 。 当 多 数 人 都 比较 谨慎 时 ,落榜 风险 一 般 说 来 比较 小 。 而 对 于 
考 后 知 分 填报 志愿 ,考生 明确 知道 了 自己 的 分 数 和 排名 ,在 心理 上 不 确定 性 
降低 了 。 换 句 话说 ,比较 敢 填 了 。 当 所 有 人 都 比较 胆 大 的 时 候 , 自然 会 “ 扎 
堆 ” 到 某 一 所 高 校 ,导致 这 所 高 校 的 报考 人 数 超出 招生 计划 数 , 从 而 使 考生 的 
落榜 风险 增 大 了 。 这 就 是 上 面 提 到 的 因 徒 困境 中 反映 出 的 问题 人 类 的 个 
人 理性 有 时 会 导致 集体 的 非 理 性 。 而 这 种 非 理性 也 常常 会 出 现在 其 他 领域 
中 ,比如 在 国内 , 当 某 个 商业 模式 获得 成 功 时 ,往往 会 出 现 创 业者 和 投资 人 扎 
堆 进入 该 领域 的 现象 ,从 而 让 整个 行业 迅速 进入 红海 ,大 家 的 日 子 都 变 得 不 


有 时 候 更 重要 的 是 如 何 选择 


既然 不 同 的 志愿 填报 方式 都 有 其 问题 ,那么 高 校 录取 机 制 究竟 还 有 没 
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有 改善 的 空间 呢 ? 虽然 Gale-Shapley 匹配 理论 已 经 日 趋 成 熟 , 但 高 校 录 取 
机 人 制 似乎 还 有 很 多 值得 探索 的 地 方 。 在 计算 机 还 没有 普及 使 用 的 年 代 , 国 
内 外 经 常 使 用 的 录取 机 制 都 停留 在 最 为 简便 的 波士顿 算法 。 原 因 是 ,过 于 
复杂 的 机 制 算 法 不 但 使 教育 主管 机 构 无 法 承受 ,而 且 更 容易 在 操作 过 程 中 
产生 错误 。 

波士顿 算法 (Boston Algorithm) 在 很 长 一 段 时 间 内 被 美国 的 公立 学 校 
广泛 采用 。 在 这 个 算法 中 ,每 个 学 生 对 所 有 N 个 学 校 进行 偏好 排序 并 作为 
录取 志愿 提交 后 ,录取 规则 如 下 : 

第 1 步 : 每 个 学 校 考虑 把 本 校 排 在 第 1 志愿 的 学 生 , 并 把 这 些 学 生 排 
序 。 如 果 录 取 名 额 大 于 等 于 学 生 数 ,录取 全 部 学 生 ; 如 果 录 取 名 额 小 于 学 生 
数 , 则 录取 排名 靠 前 的 等 于 录取 名 额 数 的 学 生 , 退 回 多 余 学 生 。 


第 让步: 每 个 学 校 考虑 把 本 校 排 在 第 & 志愿 的 学 生 , 并 把 这 些 学 生 排 
序 。 如 果 剩 余 录取 名 人 额 大 于 等 于 学 生 数 ,录取 全 部 学 生 ;如 果 录 取 名 额 小 于 
学 生 数 , 则 录取 排名 靠 前 的 等 于 剩余 录取 名 额 数 的 学 生 , 退 回 多 余 学 生 。 

直到 完成 第 N 步 ,或 者 全 体 学 生 被 录取 ,或 者 全 部 学 校 名 额 招 满 。 

我 国 过 去 的 高 考 录 取 机 制 与 波士顿 算法 基本 类 似 ,但 实践 表明 ,波士顿 
算法 是 不 稳定 的 ,在 该 算法 下 ,“ 高 分 低 就 ”现象 非常 普遍 。 

2003 年 ,美国 纽约 地 区 的 公立 学 校 开始 将 Gale-Shapley 匹配 理论 运 上 
到 学 校 录取 工作 中 ,就 连 波士顿 的 教育 主管 部 门 也 在 2005 年 放弃 了 著名 的 
波士顿 算法 ,开始 采用 新 的 招生 方式 。Gale-Shapley 匹配 理论 在 高 校 录取 机 
制 中 的 应 用 , 称 为 “延迟 接受 "算法 。 

延迟 接受 (Deferred Acceptance Algorithm) 算 法 , 即 每 个 学 生 对 所 有 N 
个 学 校 进行 偏好 排序 并 作为 录取 志愿 提交 后 ,按照 如 下 规则 录取 : 

第 1 步 : 每 个 学 校 考虑 把 本 校 排 在 第 1 志愿 的 学 生 ,并 把 这 些 学 生 排 
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序 。 留 下 最 多 为 录取 名 额 数量 的 学 生 进入 保留 名 单 ,退回 其 他 学 生 。 

第 上 步 : 对 于 上 一 步 被 退回 的 学 生 , 他 们 的 名 字 进 入 下 一 个 志愿 学 校 的 
考虑 名 单 。 学 校对 于 新 进入 的 学 生 和 保留 名 单 里 的 学 生 进行 统一 排序 , 留 下 
最 多 为 录取 名 额 数 量 的 学 生 进 入 保留 名 单 , 退 回 其 他 学 生 。 

直到 全 部 学 生 的 志愿 都 被 考虑 过 一 次 或 者 全 部 学 生 进 入 保留 名 单 为 止 ， 
此 时 保留 名 单 即 为 最 终 录 取 名 单 。 

理论 上 说 ,延迟 接受 算法 匹配 结果 是 稳定 的 ,但 这 个 的 前 提 是 学 生 和 高 
校 可 选 的 范围 没有 受到 “外 在 因素 ”的 限制 。 然 而 , 面 对 近 干 的 高 校 和 数 万 的 
专业 选择 ,不 可 能 要 求 每 个 考生 进行 完整 排序 。 在 这 里 “外 在 因素 就是: 
只 能 允许 学 生 提 交 有 限 的 志愿 数 。 由 于 可 供 学 生 排 序 的 学 校 数 目 远 远 小 于 
高 校 总 数 , 因 此 ,学 生 的 选择 是 非常 受 限 的 。 

选择 是 匹配 的 第 一 步 , 也 是 最 后 一 步 。 俗 话说 “七 分 成 绩 定 , 三 分 志愿 
拼 ”"。 有 时 候 我 们 不 得 到 不 无 奈 地 发 现 , “选择 比 努力 重要 ”, 选 择 不 同 的 大 
学 ,人 生 轨 迹 或 许 将 会 截然 不 同 , 而 且 ,对 大 部 分 人 来 说 ,只 有 一 次 选择 的 机 
会 。 从 某 种 程度 上 ,可 以 说 不 同 的 匹配 算法 ,决定 了 一 个 人 不 同 的 人 生 走 向 。 


中 国 式 匹配 : 平行 志愿 "不 平行 ” 


波士顿 算法 和 延迟 接受 算法 都 允许 每 个 学 校 自己 制定 排序 方法 ,而 不 只 
是 根据 学 生 的 考分 。 而 近 些 年 教育 部 力 推 的 “平行 志愿 ”更 加 类 似 于 分 数 独 
裁 机 制 。 对 于 所 有 学 生来 说 ,每 个 学 校 的 排序 依据 都 是 相同 的 , 即 考试 分 数 。 
同样 ,在 这 里 ,我 们 不 可 能 要 求 每 个 学 生 对 上 和 干 高 校 和 数 十 万 专业 进行 完整 
排序 ,只 能 允许 其 提交 有 限 数量 的 平行 志愿 。 

在 平行 志愿 录取 机 制 中 ,每 个 学 生 对 所 有 N 个 学 校 进行 偏好 排序 并 作 
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为 录取 志愿 提交 后 ,录取 规则 如 下 : 

第 1 步 : 分 数 排名 第 1 的 学 生 , 第 1 志愿 学 校 立即 录取 该 生 。 

第 有 步 : 分 数 排 第 上 名 的 学 生 , 顺 序 考虑 他 的 第 1.2、…… ,NN 个 志愿 学 
校 , 如 果菜 个 学 校 的 录取 名 额 还 没有 满 , 则 该 校 立即 录取 该 生 。 

直到 全 部 学 生 的 志愿 都 被 考虑 过 一 次 或 全 部 学 生 都 被 录取 为 止 。 

如 果实 行 了 平行 志愿 ,即使 你 不 能 被 第 1 志愿 录取 ,仍然 可 以 被 水 平 相 
当 的 其 他 高 校 平 行 录取 ,这 样 就 避免 了 落榜 风险 。 这 就 是 目前 多 数 省 市 实行 
的 高 考 后 知 分 填报 志愿 加 平行 志愿 的 方式 。 

有 人 用 “车 站 上 车 ”来 比喻 平行 志愿 的 录取 方式 。 

一 个 巨大 的 车 站 。 停 车 场 上 停 了 几 百 辆 汽车 ,每 一 辆 车 代表 一 个 高 校 ， 
每 辆 车 的 座位 数量 代表 了 该 校 在 该 省 的 录取 人 数 。 其 中 有 的 是 中 巴 车 ,比如 
南京 审计 学 院 , 只 有 9 个 座位 。 有 的 是 超级 大 巴 车 ,比如 四 川 大 学 ,座位 超过 
1000 个 。 

阳光 明媚 的 早晨 ,全 省 考生 按 成 绩 排名 ,站 成 一 路 纵队 ,每 个 人 手 里 都 有 
一 张 纸 条 ,上 面 写 有 自己 的 5 个 平行 志愿 的 学 校 名 字 (A.B`\C、D、E)。 

首先 ,车 站 入 口 打 开 , 状 元 先进 ,然后 入 口 关 闭 。 此 时 , 借 大 的 停车 场 ,只 
有 状元 一 人 。 状 元 的 A 志愿 是 清华 大 学 ,于 是 走 到 清华 大 学 的 中 巴 车 前 , 座 
位 全 空 ,顺利 上 车 (投档 ); 上 车 后 手 里 的 小 纸 条 作废 ,后 面 的 B.C、D\E 志愿 
再 无 任何 用 处 。 状 元 上 完 车 了 , 轮 到 榜眼 了 ,同样 只 有 他 一 个 人 进入 停车 场 ， 
此 时 探花 还 需要 等 一 等 。 榜 眼 的 A 志愿 是 北京 大 学 ,同样 座位 全 空 ,于 是 榜 
了 眼 顺 利 上 车 ,其 纸 条 作废 。 

按 顺 序 来 ,比如 ,该 排 200 名 的 同学 进 场 了 ,A 志愿 清华 大 学 ,到 清华 大 
学 的 中 巴 门口 一 看 ,80 人 的 位 置 已 经 坐 满 了 ; 转 头 又 看 也 志愿 北京 大 学 ,一 
看 70 人 的 位 置 也 满 了 ;再 看 C 志愿 浙江 大 学 ,50 人 的 座位 只 坐 了 6 人 ,于 是 
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该 同学 上 车 ,其 纸 条 作废 。 

现在 轮 到 排 1000 名 的 同学 进 场 了 ,人 A 志愿 北京 大 学 ,满员 ;B 志愿 复旦 
大 学 ,满员 ;C 志愿 武汉 大 学 ,满员 ;D 志愿 四 川 大 学 ,也 满员 了 ,此 时 该 同学 
开始 冒 汗 ;赶快 看 也 志愿 青海 大 学 ,到 青海 大 学 的 大 巴 门口 一 看 ,还 好 ,300 
个 位 置 还 有 150 个 空位 ,赶紧 上 车 ,其 纸 条 作废 。 

现在 轮 到 排 5000 名 的 同学 进 场 。A 志愿 西南 大 学 ,B 志愿 厦门 大 学 ,C 
志愿 湖南 大 学 ,D 志愿 华中 师 大 ,EE 志愿 华南 师 大 ,5 辆 车 全 部 都 满员 了 ,长 歌 
当 哭 ! 转 头 看 到 旁边 的 天 津 大 学 还 有 2 个 空位 , 想 强 行 上 车 ,被 车 站 保安 制 
止 , 纸 条 遵 没收 ,被 赶 出 停车 场 ,悲剧 收场 。 

该 最 后 一 个 学 生 了 , 排 26 000 名 进 场 。 此 时 大 多 数 汽车 已 满员 ,个 别 
车 还 有 空位 (因为 前 面 有 1000 个 不 幸 被 赶 出 车 站 的 同学 ) 。 赶 紧 把 纸 条 摸 
出 来 看 : A 志愿 川 农 ,B 志愿 川 师 ,C 志愿 北京 工商 ,D 志愿 华南 农大 ,时 运 
不 济 , 所 有 车 全 满员 。 再 看 下 志愿 天 津 大 学 ,还 有 2 个 位 置 , 谢 天 谢 地 ! 上 
车 走 人 。 

所 有 人 员 全 部 处 理 完 毕 。 车 站 站 长 一 声 令 下 , 几 百 辆 汽车 全 部 开 出 车 站 
(所 有 高 校 是 同时 投档 的 )。 省 招 办 的 工作 暂时 告 一 段落 。 

四 川 大 学 的 大 巴 车 上 。 售 票 员 进行 座位 分 配 ( 选 专业 ), 如 果 分 数 不 够 
高 , 选 不 到 好 位 置 (每 校 可 填 6 个 专业 志愿 ), 又 不 同意 售票 员 安 排 座 位 的 (不 
同意 专业 调配 ) , 那 只 好 请 你 下 车 了 ( 退 档 ) 。 于 是 灰 溜溜 地 回 到 汽车 总 站 ,与 
刚才 被 赶 出 车 站 的 1000 多 人 站 在 一 起 ,此 时 停车 场 上 空 无 一 车 。 

时 间 到 了 下 午 。 有 30 辆 当初 没有 收 满 的 车 又 开 回 来 了 (征集 志愿 开始 
了 ) ,1000 个 当初 被 赶 出 车 站 的 ,以 及 500 个 被 售票 员 赶 下 车 的 同学 ,大 家 重 
新 排队 ,重复 早上 的 过 程 。 

那么 ,为 什么 第 5000 名 的 同学 的 纸 条 会 遭 没收 ,并 被 赶 出 车 站 呢 ? 

因为 该 同学 高 估 了 自己 , 写 纸 条 时 又 不 认真 , 犯 了 低级 错误 : B.C 和 D 
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志愿 没有 任何 意义 (白白 浪费 了 三 个 名 额 1)。 因 为 ,即使 该 同学 是 全 国 状元 ， 
他 也 上 不 了 厦门 大 学 、 湖 南大 学 或 华中 师 大 的 巴士 ,因为 前 面 A 巴士 (西南 
大 学 ) 一 定 把 人 “ 截 走 ”。 

有 人 问 :“ 我 不 上 A 巴士 ,上 其 他 更 好 的 不 可 以 吗 ?” 

答案 是 :“ 不 可 以 ,必须 按 A、B、C.D.,E 的 顺序 来 1” 

“什么 ,平行 志愿 怎么 “不 平行 2 了 ?? 

的 ,这 才 是 问题 的 关键 。 对 考生 个 人 来 说 ,平行 志愿 本 来 就 是 不 平 

行 的 ! 

如 果 该 同学 的 下 志愿 不 是 填 华 南 师 大 ,而 是 广西 大 学 (还 有 5000 个 空 
位 ) ,那么 他 就 可 以 上 广西 大 学 这 辆 超级 大 巴 了 。 悔 不 当初 ! 

平行 志愿 不 平行 。 但 是 ,与 以 往 的 顺序 志愿 仍然 具有 较 大 的 差别 。 

顺序 志愿 的 方式 ,车 站 外 不 用 排队 ,2 万 多 人 一 起 涌 入 停车 场 ,各 人 按 自 
己 的 纸 条 到 对 应 的 汽车 前 面 排队 。 由 于 顺序 志愿 的 一 个 志愿 只 有 一 个 学 校 ， 
所 以 你 只 能 在 一 辆 汽车 前 面 排 队 。 按 成 绩 排 好 队 以 后 ,依次 上 车 ,满员 为 止 。 
例如 ,第 1 志愿 清华 大 学 ,第 2 志愿 四 川 大 学 ,现在 你 只 能 在 清华 大 学 的 车 前 
面 排队 ,如 果 你 排 在 清华 大 学 队列 的 最 后 一 名 ,估计 很 可 能 上 不 了 车 ,开始 冒 
汗 。 回 头 一 看 ,四 川 大 学 汽车 前 的 同学 的 分 数 都 比 你 低 , 但 你 也 只 能 继续 排 
在 清华 大 学 的 队伍 里 死 等 (其 实 并 没有 希望 ) ,眼睁睁 地 看 着 别人 上 四 川 大 学 
的 车 。 同 样 ,没有 上 车 的 同学 当即 就 被 赶 出 车 站 。 然 后 等 第 1 轮 没 有 收 满 人 
的 车 开 回 车 站 ,开始 第 2 志愿 的 排队 。 

那么 这 种 机 制 的 效果 究竟 如 何 昵 ?通常 针对 匹配 机 制 的 评价 是 基于 这 
4 项 指标 : 首先 是 稳定 性 ,由 于 在 匹配 中 没有 价格 存在 ,匹配 的 稳定 性 替代 了 
均衡 价格 和 数量 的 概念 ,表示 匹配 的 均衡 状态 , 即 匹 配 的 最 终结 果 不 会 发 生 
自愿 的 重新 匹配 ;其 次 是 无 浪费 的 性 质 , 即 匹配 机 制 使 得 愿意 匹配 的 离散 资 
源 尽 可 能 多 地 完成 匹配 ,也 就 是 常 说 的 “ 物 尽 其 用 ”; 第 三 是 讲 真 话 的 性 质 , 即 
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参与 人 不 能 通过 虚报 自己 的 序数 偏好 以 获 利 ;第 四 是 帕 累 托 有 效 (Pareto 
Efficient) 的 性 质 , 即 不 存在 一 个 新 的 匹配 结果 ,在 不 降低 其 他 离散 资源 的 效 
的 同时 使 得 至 少 一 个 离散 资源 的 效用 得 到 提高 。 

平行 志愿 与 延迟 接受 机 制 的 重要 区 别 在 于 ,延迟 接受 机 制 是 以 高 校 为 中 
心 的 (高 校 可 以 充分 地 对 比 所 有 申请 者 , 选 出 最 满意 的 学 生 ) ,而 平行 志愿 是 
以 学 生 为 中 心 的 (算法 会 优先 处 理 分 数 高 的 学 生 )。 前 面 说 过 ,由 于 学 生 的 选 
择 是 有 限 的 ,因此 ,不 论 是 波士顿 机 制 、 延 迟 接受 机 制 还 是 平行 志愿 机 制 ,其 
匹配 结果 都 是 不 稳定 的 。 即 使 如 此 ,其 不 稳定 的 程度 仍然 不 同 。 有 人 通过 实 
验 比较 了 平行 志愿 ,波士顿 和 延迟 接受 机 制 , 发 现 平行 志愿 机 制 的 稳定 性 高 
于 波士顿 机 制 ,但 是 低 于 延迟 接受 机 制 。 男 一 方面 ,由 于 学 生 只 能 提交 一 次 
高 考 志愿 ,对 应 到 算法 里 ,就 是 学 生 对 高 校 的 偏好 列表 是 一 开始 就 确定 的 。 
因此 ,三 种 机 制 都 无 法 有 效 避 免 “ 大 小 年 现象。 例如 , 某 高 校 去 年 的 录取 分 
数 非常 低 , 今 年 可 能 意外 地 非常 高 。“ 大 小 年 ”往往 导致 学 生 “ 扎 堆 ” 到 某 一 所 
高 校 ,导致 这 所 高 校 的 报考 人 数 超出 招生 计划 数 ,或 者 某 一 所 高 校 * 无 人 间 
津 ”, 导 致 这 所 高 校 无 法 招 到 满意 的 学 生 。 

一 种 可 行 的 方案 ,可 以 允许 学 生 多 次 填报 志愿 , 即 学 生 的 偏好 可 以 根据 
预 填 结果 动态 调整 。 然 而 ,这 样 的 方案 背后 需要 强大 的 算法 和 复杂 的 操作 来 
支撑 ,会 导致 成 本 大 大 增加 。 对 此 ,我 们 只 能 根据 招生 中 使 用 的 匹配 算法 规 
律 ,给 出 一 些 针 对 平行 志愿 机 制 下 的 填报 建议 : 

高 考 考试 完 不 是 战斗 结束 而 是 开始 ,志愿 的 填报 是 第 2 次 高 考 ,这 时 考 
的 不 是 努力 程度 , 考 的 是 做 选择 的 能 力 。 这 时 ,选择 比 努 力 重要 。 
尽量 使 多 个 平行 志愿 之 间 具 有 梯度 。 有 人 片面 地 认为 平行 志愿 没有 上 顺 
序 , 几 所 院 校 都 一 样 ,这 是 不 对 的 。 录 取 时 是 按照 考生 自己 填报 的 顺序 依次 
进行 检索 的 。 因 此 ,一 定 要 把 最 想 去 的 院 校 放 在 最 前 面 。 第 一 所 院 校 的 录取 
分 数 可 以 高 一 些 , 往 后 要 按照 院 校 今 年 可 能 的 录取 分 数 梯次 降序 排列 。 否 
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则 , 若 第 一 所 院 校 录取 不 上 ,后 面 几 所 院 校 有 可 能 都 录取 不 上 ,成 为 无 效 
估 分 填报 时 ,在 理性 估 分 后 多 参考 历史 经 验 ,将 “高 分 低 就 ”风险 降 到 
最 低 。 
知 分 填报 时 ,热门 或 者 冷门 的 高 校 和 专业 要 谨慎 选择 。 因 为 平行 志愿 机 
制 下 仍然 没有 避免 出 现 “ 大 小 年 "现象 ,所 以 要 科学 地 分 析 院 校 录取 数据 。 


互联 网 思维 去 没有 中 间 商 赚 差 价 


在 市 场 上 常常 可 以 看 到 一 种 情况 : 那个 叫喊 得 最 凶 的 和 亚 发 得 最 厉害 
的 人 , 正 是 希望 把 最 坏 的 货物 推销 出 去 的 人 。 


一 列宁 


志愿 填报 的 例子 也 说 明了 匹配 市 场 的 信息 对 称 性 问题 。 在 知 分 填报 志 
愿 的 方式 下 ,大 部 分 人 都 不 会 仅仅 以 自己 和 周围 同学 的 分 数 作 参 考 , 而 是 想 
方 设法 去 了 解 全 省 报考 某 一 所 高 校 的 考生 的 数量 ,并 认为 只 有 这 样 才能 做 出 
更 加 准确 的 判断 。 了 解 全 省 几 十 万 考生 信息 与 了 解 全 校 信息 相 比 ,其 成 本 显 
然 不 是 一 个 数量 级 。 而 最 终 能 和 否 被 录取 , 则 完全 取决 于 全 国 到 底 有 多 少 人 填 
报 了 这 所 高 校 的 这 个 专业 。 而 考 前 和 考 后 估 分 填报 志愿 ,考生 搜集 信息 花费 
较 少 的 成 本 ,通过 往届 考生 成 绩 、 排 名 、 录 取 院 校 情况 即 可 做 出 判断 。 因 此 ， 
不 同 的 高 考 志愿 填报 方式 下 ,考生 所 面临 的 信息 搜集 成 本 是 不 同 的 。 信 息 搜 
集成 本 的 存在 ,导致 了 因 个 体 差异 引发 的 信息 不 对 称 。 

在 匹配 中 ,信息 的 对 称 性 会 影响 匹配 的 结果 ,掌握 更 多 信息 的 一 方 在 经 
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济 活动 中 往往 处 于 更 有 利 的 位 置 。 玩 过 游戏 的 朋友 可 能 都 有 这 个 经 历 : 当 
你 的 地 图 上 全 是 战争 迷雾 ,而 对 方 地 图 清晰 可 见 时 ,你 很 难 赢得 游戏 。《 史 
记 》 里 * 田 忌 赛马 ” 讲 的 也 是 一 个 利用 信息 不 对 称 而 获胜 的 故事 。 田 忌 掌 握 了 
所 有 马 的 速度 和 齐 威 王 出 马 的 顺序 ,这 有 利于 他 更 好 地 制定 比赛 策略 。 

齐 威 王 要 与 田 忌 赛 马 ,规定 每 个 人 从 自己 的 上 、 中 、 下 三 等 马 中 各 选 一 匹 
来 赛 ; 每 有 一 匹 马 来 比赛 ;每 有 一 匹 马 取胜 可 获 一 千 两 黄金 ,每 有 一 匹 马 落后 
要 付 一 千 两 黄金 。 齐 威 王 的 每 一 等 次 的 马 比 田鼠 同样 等 次 的 马 都 要 强 , 因 
而 ,如 果 田 忌 用 自己 的 上 等 马 与 齐 王 的 上 等 马 比 , 用 自己 的 中 等 马 与 齐 王 的 
中 等 马 比 ,用 自己 的 下 等 马 与 齐 威 王 的 下 等 马 比 , 则 田 忌 要 输 三 次 ,要 输 黄金 
三 千 两 。 田 忌 的 谋士 孙 爱 让 田 忌 用 自己 的 下 等 马 去 与 齐 威 王 的 上 等 马 比 ,用 
自己 的 上 等 马 与 齐 威 王 的 中 等 马 比 ,用 自己 的 中 等 马 与 齐 威 王 的 下 等 马 比 。 
田 忌 的 下 等 马 当 然 会 输 ,但 是 上 等 马 和 中 等 马 都 赢 了 。“ 三 局 两 胜 ”, 田 忌 不 
仅 没 有 输 掉 黄金 三 千 两 ,还 赢 了 黄金 一 千 两 。 

信息 不 对 称 让 匹配 市 场 难以 用 最 高 效率 实现 , 令 供求 双方 蒙受 损失 。 

20 世纪 70 年 代 , 美 国 经 济 学 家 乔治 。 亚 瑟 。 阿 克 洛 夫 曾 发 表 过 一 篇 名 
为 《柠檬 市 场 : 质 化 的 不 确定 性 和 市 场 机 制 ) 的 论文 。 在 二 手 车 市 场 中 ,买主 
无 法 辨别 汽车 高 低 质 量 的 区 别 , 只 有 卖主 才 知 道 这 一 点 ,因而 在 可 获得 的 信 
息 方面 出 现 了 不 对 称 性 。 低 质量 汽车 与 高 质量 汽车 以 完全 相同 的 价格 销售 。 
由 于 价格 空间 浮动 较 大 ,最 终 低 质量 汽车 很 可 能 将 高 质量 汽车 驱逐 出 市 场 。 
这 在 经 济 学 中 称 为 “ 劣 币 驱 逐 良 币 ”。 信 息 不 对 称 问题 可 能 导致 整个 市 场 崩 
涡 , 或 者 市 场 姜 缩 ,以 至 于 只 有 劣 等 产品 充斥 其 中 。2001 年 ,瑞典 皇家 科学 
院 将 诺 贝尔 经 济 学 奖 授予 乔治 。 亚 瑟 。， 阿 克 洛 夫 等 三 位 经 济 学 家 ,以 表彰 他 
们 在 市 场 信息 不 对 称 研究 中 所 做 出 的 卓越 贡献 。 

信息 不 对 称 导致 的 匹配 问题 因 互联 网 的 兴起 得 以 改善 。 利 用 互联 网 技 
术 并 发 挥 匹配 作用 的 各 个 平台 也 应 运 而 生 , 在 租房 中 介 、 二 手 车 、 二 手 房 交易 


109 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


等 市 场 都 产生 了 相应 的 创新 型 商业 模式 。 近 年 兴起 的 “互联 网 思维 ”将 “互联 
网 消除 信息 不 对 称 ” 的 能 力 ,理解 为 "凡是 因 信息 不 对 称 而 获 利 的 公司 都 会 被 
互联 网 颠覆 !”。 然 而 ,事实 真 的 是 这 样 吗 ? 


假如 没有 中 间 商 


酒 桌 常 有 “行家 ?” 告 诚 大 家 说 :“ 一 瓶 酒 300 块 ,120 块 是 广告 费 , 经 销 商 
拿 了 100, 厂 家 自己 挣 50, 酒 的 成 本 其 实 只 有 30 块 "。 听 “行家 ”说 完 ,大 部 分 
人 可 能 都 会 产生 “ 买 贵 了 ”的 感觉 。 

然而 ,如 果 没有 经 销 商 和 广告 商 ,那么 消费 者 与 酒 厂 之 间 的 匹配 渠道 将 
由 谁 来 完成 呢 ? 事实 上 ,在 复杂 的 市 场 环 境 中 ,由 于 中 间 商 的 存在 ,交易 环节 
不 增 反 减 ,交易 成 本 不 增 反 降 。 如 果 削 掉 合理 的 中 间 环 节 , 消 费 者 拿 到 手 里 
的 商品 价格 只 会 升 高 而 不 会 降低 。 正 是 因为 中 间 商 “知道 得 太 多 了 ”, 因 而 简 
化 了 交易 关系 ,减少 了 交易 双方 为 了 达成 交易 所 需 联 系 的 数量 和 时 间 , 让 交 
易 成 本 更 低 。 

如 图 3.16 所 示 ,A 部 分 显示 了 三 个 生产 者 以 直销 的 方式 分 别 接触 三 个 
消费 者 ,在 这 个 系统 中 ,存在 9 次 交易 联系 ;B 部 分 显示 了 三 个 生产 者 通过 一 
个 中 间 商 与 三 个 顾客 连接 ,这 个 系统 只 要 求 6 次 交易 联系 。 可 以 看 出 ,中 间 


M EC M C 
M e M 上 D | 一 C 
M ee M 冯 
A- 交 易 联系 B- 交 易 联系 
MXC=3X3=9 M+C=3+3=6 
M= 生 产 者 C= 消费 者 D= 中 间 商 


图 316 中 间 商 效果 图 
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商 的 存在 减少 了 必须 进行 的 工作 量 , 而 且 消 费 者 越 多 ,生产 者 越 多 ,中 间 商 的 
价值 就 越 大 。 

“厂家 直销 ,没有 中 间 商 赚 差 价 ” 和 “0 佣金 0 手续 费 !1” 等 听 起 来 很 美好 ， 
然而 ,这 一 切 只 是 依靠 营销 手段 为 消费 者 编织 的 童话 ,并 不 是 真正 意义 上 的 
没有 中 间 商 。 其 本 质 是 减少 中 间 商 参与 的 交易 ,而 中 间 商 则 有 了 新 含义 。 


匹配 ,让 中 间 商 经 济 实现 向 共享 经 济 的 进化 


“共享 经 济 会 在 21 世纪 下 半 叶 成 为 社会 主导 的 经 济 形态 ”, 未 来 学 家 与 
经 济 学 家 杰 里 米 ， 里 夫 金 (Jerermy Rifkin) 的 这 一 预言 正在 被 一 步 步 实 现 。 
在 赛 博 新 经 济 的 范畴 ,共享 经 济 当 属 时 下 最 流行 的 新 经 济 范式 。 

将 共享 经 济 理念 践 行 得 最 为 成 功 的 , 非 Airbnb 莫 属 。 在 这 一 经 济 活动 
中 ,Airbnb 要 做 好 房东 与 房客 之 间 的 匹配 ,除了 根据 房东 和 房客 的 偏好 做 个 
性 化 推荐 以 外 ,还 需要 解决 一 个 更 为 棘手 的 难题 , 那 就 是 信任 体系 。 

总 部 位 于 旧金山 的 Airbnb 是 短 租 行业 的 始祖 , 自 2008 年 上 线 , 它 创 建 
了 帮助 人 们 将 空房 和 沙发 变现 的 模式 ,截至 目前 ,Airbnb 在 全 球 192 个 国家 
3. 3 万 个 城市 总 房 源 超过 230 万 ,并 拥有 超过 6 亿 个 社会 关系 。 

为 信任 而 设计 是 传统 酒店 行业 最 重要 的 主题 ,而 Airbnb 的 使 命 是 赋予 
个 体 最 大 的 自由 度 ,因而 会 更 大 程度 地 依赖 这 种 信任 关系 。 让 一 位 完全 陌生 
的 人 住 在 自己 家 里 , Airbnb 这 种 想法 实在 太 过 疯狂 了 。 毕 竟 从 小 妈妈 就 告 
诉 我 们 :“ 不 要 和 陌生 人 说 话 ”。 

所 有 通过 Airbnb 的 交易 都 可 以 查 到 交易 发 生 时 使 用 的 信用 卡 , 接 着 是 
根据 银行 办 卡 时 的 实名 信息 ,总 能 追查 到 某 个 人 。 所 以 主人 或 房客 无 论 哪 一 
个 做 坏事 ,风险 都 非常 之 高 。 在 解决 这 个 问题 上 ,Airbnb 利用 在 线 社交 网 络 
脸 书 (Facebook) 来 帮助 其 解决 这 个 问题 。 脸 书 是 很 注重 实名 制 的 社交 平台 。 
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当 房客 用 脸 书 账号 登录 Airbnb ,并 搜索 一 个 城市 的 房间 信息 时 ,Airbnb 会 显 
示 房 客 和 房东 之 间 的 社会 关系 。Airbnb 甚至 将 Facebook 的 这 种 社交 网 络 
功能 推 向 极致 , 它 做 了 一 个 名 为 “Airbnb 社交 关联 ”的 过 滤 功 能 ,专门 给 用 户 
提供 房客 对 社交 圈 内 房东 的 查找 。 比 如 , 搜 出 来 的 房东 或 者 是 朋友 的 朋友 ， 
或 者 是 同一 个 大 学 毕业 的 ,或 者 是 朋友 在 那里 住 过 并 且 写 过 评价 的 ,这 相当 
于 在 熟人 图 里 找 住处 。 通 过 这 个 功能 搜索 房 源 ,搜索 获得 的 所 有 房东 都 与 房 
客 具 有 某 种 社会 关系 ,房客 的 安全 感 会 提升 ,对 房客 来 说 比 住 在 陌生 人 家 里 
有 更 大 吸引 力 。 

除 Facebook 之 外 ,如 果 这 个 房东 的 LinkedIn 被 绑 定 的 话 , 他 的 可 信 度 
也 会 大 大 增加 。 因 为 与 Facebook 一 样 ,LinkedIn 也 是 实名 制 ,而 且 信息 包涵 
用 户 教育 经 历 . 工 作 经 历 , 以 及 现在 就 职 的 地 方 ,因此 ,LinkedIn 对 美国 人 找 
工作 已 经 越 来 越 重要 ,如 果 这 个 账号 被 盗 ,将 是 一 件 非常 严重 的 事 。 所 以 大 
部 分 用 户 都 会 认为 : 如 果 房 东 愿 意 把 LinkedIn 绑 定 到 Airbnb 上 ,房东 似乎 
在 传达 一 个 意思 : 我 做 Airbnb 是 认真 的 ,以 工作 为 保证 。 另 一 个 评估 房东 
可 信和 度 的 重要 方式 是 ,查看 房东 收 到 的 以 往 房客 对 他 的 评价 ,如 果 以 往 房客 
都 给 他 好 评 的 话 ,就 可 以 大 概 判断 该 房东 是 可 以 信赖 的 。 最 后 ,Airbnb 推出 
了 “身份 验证 ”项 目 , 所 有 Airbnb 用 户 都 必须 验证 身份 。 

共享 经 济 的 终 级 奥妙 就 是 ,我 暂时 不 用 的 东西 你 正好 用 得 上 。 租 车 界 的 
Airbnb 当 属 优 步 (Uber) 。 作 为 一 个 提供 私家 车 搭乘 服务 的 02O 网 站 , 它 通 
过 GPS 追踪 定位 私家 车 ,用 户 可 以 使 用 Uber 发 出 打车 请 求 ; 几 分 钟 内 一 辆 
私家 车 就 会 开 到 你 面前 ,费用 则 是 通过 信用 卡 交易 来 完成 。 把 Airbnb 的 概 
念 用 到 办 公 室 上 就 有 了 ShareDesk 之 类 的 服务 。 一 方面 公司 可 以 提供 闲置 
的 办 公 桌 会议 室 等 , 男 一 方面 移动 办 公 族 可 以 在 任何 地 点 工作 。 共 享 经 济 
出 现在 越 来 越 多 的 领域 ,如 3D 打印 机 ,传授 技能 和 零工 等 。 乌 马尔 - 哈 克 
在 《新 资本 主义 宣言 ) 中 预言 “如 果 传 统 消费 减少 10%, 而 共享 消费 增加 


互 
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10% ,那么 传统 企业 的 利润 率 将 受到 显著 影响 ;如 果 传统 企业 不 能 进行 改变 ， 
其 至 可 能 会 被 淘汰 .” 共 享 经 济 的 出 现 将 在 很 多 领域 抢占 传统 经 济 的 市 场 。 

在 共享 经 济 里 ,中 间 商 演化 成 了 平台 ,匹配 渠道 平台 化 。 中 间 商 改 了 个 
名 字 , 称 为 平台 商 。 例 如 ,Airbnb 不 仅 向 租 客 收取 6%~12% 的 费用 ,还 会 收 
取 房 东 3% 的 附加 费用 。 有 些 中 间 商 则 演化 成 了 纯粹 的 平台 提供 者 ,不 再 收 
取 任 何 服务 费用 ,而 是 利用 多 边 市 场 寻求 其 他 商业 模式 ,如 流量 变现 数据 变 
现 等 。 例 如 ,Facebook 的 95% 以 上 收入 来 自 广告 ,阿里 巴巴 的 主要 收入 也 来 
自 广告 和 服务 费 。 

“共享 ”二 字 曾 含 着 无 限 大 的 想象 空间 。 首 先 ,共享 经 济 让 传统 的 中 间 商 
平台 化 ,平台 化 的 匹配 行为 ,让 消费 者 拥有 更 大 的 掌握 权 , 交 易 完 全 透明 化 。 
从 直觉 上 理解 ,就 是 参与 人 知道 的 信息 越 多 ,他 的 选择 就 会 更 优 。 其 次 ,共享 
经 济 中 存在 很 多 去 中 介 的 交易 ,有 中 介 的 交易 ,由 中 介 提 供 担 保 , 而 去 中 介 的 
交易 , 则 需要 像 Airbnb 一 样 设计 相应 的 信用 机 制 , 保 证 匹配 的 有 效 性 。 类 似 
的 还 有 淘宝 网 ,如 果 买 家 和 卖家 的 信用 分 高 ,匹配 就 容易 完成 ,因为 信用 分 代 
表 “ 公 民 素 质 ”, 是 影响 双向 选择 的 偏好 性 指标 。 可 以 说 ,“ 共 享 经 济 时 代 ” 是 
“中 间 商 时 代 ” 的 进化 ,但 不 论 怎 么 演化 ,其 核心 都 是 ,让 信息 对 称 , 提 高 信息 
匹配 效率 。 


匹配 算法 设计 下 的 赛 博 新 经 济 


在 现实 生活 中 ,还 有 很 多 市 场 都 处 于 “商品 市 场 " 和 “匹配 市 场 ” 之 间 , 市 
场 是 可 以 被 设计 的 。 罗 斯 开创 了 一 个 全 新 的 经 济 学 分 支 一 一 市 场 设计 , 即 寻 
求 在 市 场 失灵 、 无 法 依靠 价格 这 单一 因素 保证 其 正常 运行 时 的 资源 配置 方 

。 罗 斯 的 匹配 理论 实践 ,有 效 改变 了 公立 学 校 、 肾 脏 捐 献 以 及 住院 医师 岗 
位 配置 的 市 场 设计 和 功能 。 在 共享 经 济 模式 中 ,利用 延迟 接受 算法 ,为 市 场 
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的 中 心 调度 制定 规则 ,可 以 确保 选择 双方 形成 稳定 匹配 ,从 而 优化 市 场 资源 
配置 ,提高 市 场 运行 的 效率 。 

“ 钱 不 是 万 能 的 ”, 因 为 匹配 市 场 还 需要 匹配 算法 这 只 “无 形 的 手 ”。“ 没 
钱 是 万 万 不 能 的 ”, 因 为 市 场 设计 就 是 综合 “ 钱 ” 这 一 因素 的 供需 匹配 机 制 设 
计 , 是 研究 如 何 利 用 “ 钱 ” 和 匹配 理论 来 实现 资源 最 优 配 置 的 新 学 科 。 介 于 
“商品 市 场 " 和 ”匹配 市 场 " 之 间 的 市 场 中 ,最 典型 的 就 是 拍卖 。 拍 卖 设计 是 市 
场 设计 中 最 活跃 的 部 分 ,拍卖 有 多 种 组 织 方式 ,但 不 论 是 什么 方式 ,拍卖 最 古 
老 的 功能 之 一 就 是 价格 发 现 : 市 场 会 告诉 你 能 从 所 卖 商 品 中 寻找 到 怎样 的 
价位 ,并 且 你 能 够 对 谁 以 这 样 的 价格 出 售 。 正 如 罗斯 所 说 :“ 拍 卖 是 将 卖方 
和 最 珍视 所 卖 的 商品 的 买方 匹配 起 来 的 市 场 ”。 匹 配 是 一 个 非常 重要 的 市 场 
设计 手段 ,匹配 算法 设计 下 的 市 场 ,也 将 成 为 一 个 更 机 智 、 更 敏捷 的 智能 经 济 
市 场 。 
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2017 年 4 月 9 日 发 生 了 一 件 令 美 联 航 陷入 空 


美国 人 陶 大 卫 改 签 ,但 被 他 以 次 日 需要 出 诊 为 由 拒绝 。 


前 危机 的 事件 。 
当天 晚上 , 美 联 航 UA3411 航班 正 准备 从 芝加哥 飞 往 肯 塔 基 , 但 乘客 登 
后 , 却 被 机 组 以 机 票 超 售 为 由 ,要 求 其 中 4 名 乘客 必须 下 飞机 改 乘 其 他 航 
班 。 为 了 让 乘客 主动 下 飞机 ,机 组 人 员 提 出 赠送 旅行 代金 券 ,但 这 并 没有 引 
起 任何 回应 。 最 后 航空 公司 以 随机 抽取 乘客 的 模式 ,请 


一 位 69 岁 的 越南 裔 
没 想 到 的 是 ,最 后 这 


位 乘客 被 机 场 保安 强行 拖 下 飞机 ,在 拖 搜 过 程 中 ,他 嘴角 奢 破 出 血 , 衣 服 也 被 
撕 扯 …… 当 时 在 场 的 其 他 乘客 都 被 这 个 场景 震惊 , 拍 下 的 视频 随后 在 全 球 互 
受 超 售 事件 影响 , 美 联 航 


联网 迅速 传播 ,给 美 联 航 造成 了 严重 的 负面 影响 。 
股价 于 4 月 11 日 大 跌 ( 如 图 4.1 所 示 ) 。 


这 里 我 们 先 不 讨论 美 联 航 自身 的 客户 关系 管理 以 及 此 次 事件 处 理 的 合 


法 性 问题 ,我 们 想 知 道 的 是 ,为 什么 航空 公司 的 售票 


系统 发 


展 至 今 , 仍 然 会 有 
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United's stock is falling 1.2% and wiping $300| 
million off the airline's market cap 


Published: Apr 11. 2017 3:54 p.m. ET 
[ow |e] e399 | 
Carrier continues to drow flak for hoving customer dragged off plone 


Unged's stock sioes Tuesdey. Dus off Rs premerke Iow 


图 41 美 联 航 股价 于 4 月 人 1 日 大 跌 


超 售 问题 发 生 ? 为 了 保护 消费 者 ,政府 为 什么 不 干脆 明令 禁止 超 售 ? 

从 1978 年 航空 业 放 开 管 制 到 2005 年 ,美国 已 经 有 160 多 家 航空 公司 破 
产 , 兼 并 收购 屡见不鲜 ;在 1990 一 1999 年 这 段 时 间 , 航 空 业 的 利润 率 是 全 美 
国 所 有 行业 平均 水 平 的 六 分 之 一 ;2001 年 “9. 11” 恐 怖 袭击 事件 的 发 生 , 让 
大 多 航空 公司 在 之 后 一 段 时 间 处 于 严重 亏损 。 航 空 公司 之 所 以 越 来 越 难 赚 
钱 ,与 需求 一 直 在 动态 变化 有 很 大 关系 。 对 每 个 航班 来 说 ,供给 的 数量 是 固 
定 的 ,因为 飞机 上 的 座位 是 固定 的 。 对 每 个 航班 而 言 ,需求 又 是 复杂 多 变 的 ， 
乘客 人 数 取决 于 很 多 不 确定 因素 ,例如 天 气 .重大 活动 经济 景气 程度 等 。 同 
时 ,每 个 乘客 的 支付 意愿 不 同 ,乘客 的 偏好 和 需求 还 可 能 随时 间 而 变化 。 所 
以 , 既 要 把 给 定 的 供给 销售 给 动态 变化 的 需求 方 ,而 且 还 要 最 大 化 收益 是 非 
常 困难 的 。 而 且 , 航 空 公司 之 间 的 竞争 也 在 不 断 加剧 。 乘 客 需要 的 是 从 A 
地 用 最 快 的 速度 赶 到 B 地 ,就 这 一 点 来 说 ,航空 公司 之 间 提 供 的 服务 很 难 有 
本 质 区 别 。 由 于 产品 和 服务 不 容易 差异 化 ,价格 战 就 难以 避免 “宁可 亏 钱 也 
不 空位 >, 有 些 公司 甚至 把 票 价 降 到 几乎 为 零 来 多 吸引 乘客 。 
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这 也 导致 了 机 票 超 售 成 为 航空 公司 优化 收益 的 最 好 做 法 。 机 票 超 售 的 
意思 是 ,航空 公司 会 卖 出 比 飞 机 上 座位 数量 更 多 的 机 票 ,因为 统计 数据 表明 ， 
总 会 有 部 分 乘客 临时 取消 行程 或 者 干脆 到 时 不 出 现 , 这 时 如 果 有 一 定 比例 的 
超 售 ,那么 飞机 上 的 座位 不 至 于 有 太 多 的 浪费 。 图 4. 2 给 出 了 美国 各 大 航空 
公司 的 机 票 超 售 比率 ,可 以 看 出 ,机 票 超 售 是 各 大 航空 公司 普遍 使 用 的 策略 。 


器 Involuntary denied boarding per 10000 passengers 
国 voluntary denied boarding per 10000 passengers 


图 42 美国 各 大 航空 公司 的 机 票 超 售 比率 


服务 业 的 产能 是 有 时 效 性 的 ,飞机 起 飞 后 的 空 座位 ,夜晚 降临 后 的 酒店 
空房 都 是 纯粹 的 浪费 ,对 企业 是 不 可 弥补 的 损失 。 当 今世 界 的 各 大 航空 公司 
都 会 超 售 , 也 就 是 卖 出 比 座位 数 更 多 的 票 。 超 售 多 少 的 决策 取决 于 历史 数据 
和 不 同 公司 的 战略 考量 。 超 售 最 理想 的 结果 就 是 不 出 现 的 乘客 数 正 好 等 于 
超 售 的 数量 ,这 样 飞机 刚好 坐 满 ,皆大欢喜 。 如 果 临 时 不 来 的 乘客 大 于 超 售 
数量 ,飞机 上 会 有 空位 ,航空 公司 将 承受 机 会 损失 。 如 果 临 时 不 来 的 乘客 小 
于 超 售 数量 ,肯定 会 有 人 上 不 了 飞机 ,航空 公司 必须 提供 补偿 ,寻求 自愿 换 到 
下 个 航班 的 旅客 ;如 果 提 供 了 很 高 的 补偿 数额 还 是 没有 足够 多 的 志愿 者 , 航 
空 公司 就 会 像 前 面 提 到 的 美 联 航 事件 一 样 , 不 得 不 对 乘客 下 逐 客 令 了 。 
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美 联 航 的 超 售 事情 ,也 让 我 们 发 现 超 售 是 有 风险 的 , 它 有 可 能 给 消费 者 
带 来 极 坏 的 用 户 体验 ,还 可 以 导致 航空 公司 的 信任 危机 ,但 是 政府 部 门 却 一 
般 不 会 明令 禁止 航空 公司 这 样 做 。 如 果 我 们 换个 角度 看 ,这 样 做 也 并 没有 什 
么 问题 。 首 先 , 归 根 结 底 , 超 售 对 大 多 数 消费 者 有 好 处 。 如 果 不 允 许 超 售 , 那 
么 航空 公司 空 座 率 会 更 高 ,为 了 盘 利 ,航空 公司 会 提高 票 价 ,最 终 还 是 消费 者 
买单 。 其 次 , 超 售 对 社会 福利 是 有 好 处 的 。 从 社会 整体 来 看 ,我 们 需要 最 有 
效 地 利用 资源 ,同时 避免 浪费 资源 。 因 此 最 优 策略 是 尽量 让 每 架 飞 机 都 坐 
满 ,否则 每 个 空 座位 都 是 对 资源 的 浪费 。 

男 一 方面 “市 场 决 定价 格 ” 的 市 场 经 济 在 全 球 发 展 一 百 余年 ,在 中 国 也 
已 经 开展 了 二 十 几 年 ,更 多 时 候 市 场 的 力量 比 法 律 的 手段 更 有 效 。 政 府 需 要 
做 的 就 是 让 市 场 干净 公平 , 剩 下 的 事情 ,市 场 的 最 终 选择 会 给 出 一 个 最 正义 
的 结果 。 而 之 所 以 市 场 会 这 么 强大 ,只 因为 经 济 学 有 一 个 最 基本 的 假设 , 即 
“理性 人 假设 ”。 当 我 们 讨论 理性 人 时 ,我 们 所 有 的 市 场 行为 和 决策 都 会 从 最 
有 利于 自己 并 让 自己 利益 最 大 化 这 一 点 出 发 ,而 不 考虑 社会 伦理 道德 等 其 他 
因素 。 例 如 ,在 2005 年 ,五 级 飓风 卡特 里 娜 席卷 美国 港口 城市 新 奥尔良 , 随 
之 而 来 的 巨 浪 酿 成 洪水 惨剧 ,由 于 没有 足够 的 物资 储备 ,发 生 了 哄抬 价格 事 
件 ,药物 食品 抢 售 一空 。 人 们 也 许 会 择 击 在 灾难 之 后 提高 物价 的 店家 不 人 
道 ,但 是 按照 理性 人 的 假设 ,当面 对 明显 增加 的 需求 时 ,供给 的 不 足 自然 会 导 
致 价格 的 急剧 上 升 ,这 其 实 非常 合理 。 因 此 ,在 市 场 机 制 比较 完善 的 国家 并 
没有 《价格 法 》, 只 有 《 反 垄 断 法 》。 

当然 , 遇 到 超 售 改 签 并 不 是 一 个 大 概率 事件 。 根 据 数 据 统计 ,大 约 每 
1000 人 中 有 一 个 人 会 被 超 售 影响 ,自愿 或 非 自 愿 地 更 换 航 班 ,被 强制 改 签 的 
乘客 ( 非 自 愿 更 换 航 班 ) 大 约 是 每 万 人 中 有 一 到 两 个 。 所 以 美 联 航 事件 虽然 
会 让 超 售 在 一 段 时 间 内 成 为 争议 的 焦点 ,但 可 以 预料 的 是 ,航空 公司 并 不 会 
因此 改变 超 售 的 策略 。 
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除了 超 售 ,航空 公司 还 有 一 个 常见 的 策略 是 机 票 打折 。 大 家 可 能 都 有 体 
会 ,如 果 行程 能 够 尽早 确定 ,那么 早 订 机 票 通常 会 更 加 便宜 。 随 着 出 行 日 期 
的 日 益 临近 ,机 票 价格 则 会 不 断 上 涨 ,直到 机 票 售 完 。 当 然 还 有 一 种 情况 ,如 
果 直到 飞机 临 起 飞 前 ,机 票 仍然 没有 售 完 , 可 能 会 以 很 低 的 价格 出 售 , 如 果 你 
冒 着 不 能 成 行 的 风险 等 到 了 最 后 一 分 钟 , 可 能 会 遇 到 很 大 的 价格 惊喜 。 这 个 
价格 变动 的 过 程 其 实 就 是 动态 定价 。 这 里 描述 的 是 简单 情况 ,其 实 航 空 公司 
的 机 票 价格 是 一 个 很 复杂 的 过 程 , 本 章 后 面 会 有 更 详细 的 介绍 。 

实际 上 , 超 售 问题 体现 了 供需 的 矛盾 ,这 种 矛盾 随 着 赛 博 新 经 济 时 代 的 
到 来 ,在 一 些 新 的 商业 模式 中 表现 得 更 为 突出 。 例 如 在 出 行 领域 , 像 滴 滴 出 
行 这 类 公司 ,客户 的 需求 变化 更 为 剧烈 ,对 价格 调节 供需 的 实时 性 要 求 也 就 
越 来 越 苛刻 ,响应 时 间 从 每 天 到 每 秒 ,这 背后 依靠 的 就 是 不 断 优化 的 动态 定 
价 算法 。 可 以 说 ,航空 公司 是 动态 定价 算法 的 早期 实践 者 ,通过 动态 调整 票 
价 把 有 限 资源 做 动态 分 配 ,虽然 目前 还 不 能 完全 避免 超 售 带 来 的 问题 ,但 是 
它 为 动态 算法 的 发 展 和 演进 提供 了 思路 。 动 态 定价 算法 的 进步 也 在 不 断 地 
推动 越 来 越 多 的 行业 发 生 商 业 模 式 的 变革 。 


动态 定价 不 仅仅 是 一 系列 传统 定价 方法 的 策略 组 合 


什么 是 “精明 ”的 人 ? 
他 通晓 世间 万 物 的 价 码 ， 
但 对 其 价值 却 一 无 所 知 。 
一 一 奥斯卡 。 王 尔 德 ,英国 作家 
也 许 大 家 都 有 “ 花 冤 枉 钱 ” 的 经 历 , 刚 刚 在 实体 店 买 的 正 价 商品 , 回 到 
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家 上 网 一 看 , 呀 ,网 上 商城 正在 打折 出 售 ,或 者 才 在 网 上 下 单 的 电子 产品 ， 
几 天 时 间 价 格 竟 下 跌 了 一 半 。 是 的 ,商家 总 会 为 了 卖 出 更 多 的 商品 ,根据 
渠道 .客户 .商品 的 不 同 , 在 一 定时 间 内 打折 促销 ,这 就 是 最 简单 的 动态 
定价 。 
在 传统 的 市 场 定 价 中 ,商品 往往 先 定 价 再 出 售 。 在 制定 合理 的 价格 时 ， 
“产品 生命 周期 理论 ”(product life cycle, PLC) 常 被 用 到 。 这 是 美国 哈佛 大 学 
教授 雷 蒙 德 . 费 农 于 1996 年 提出 的 。 费 农 认 为 : 产品 和 人 的 生命 一 样 经 历 
引入 成 长 .成熟 .衰退 4 个 阶段 (如 图 4. 3 所 示 ) ,处 于 不 同 产品 生命 周期 的 
人 和 群 有 不 同 的 消费 特点 。 


1 
| 
1 1 
1 1 
A I I SS 
1 i 1 1 
1 1 | 1 
1 1 1 1 
1 1 1 1 
1 1 ! 1 阶段 五 
客户 获取 ”| 客户 提示 。 | 客户 成 熟 “| ”客户 衰退 | 客户 退出 
(acquisition) | (build-up) | (climax) | (decline) ! (CexiD 
1 1 1 1 
如 何 提供 更 | 如 何 提高 现 ! 如 何 保持 “| 如何 延长 | 如 何 挽回 
关键 问题 》 ”加 满足 用 户 | 有 用 户 价值 | 客户 忠诚 ?1 ”用户 生命 1 流失 的 客户 ? 
需求 的 产品 ? | | | 周期 ? | 
解决 方 潜 ) 。 深 控 需求 。 | 价值 提升 。 | 回报 计划 “| 。 客户 保留 “| 客户 换 加 
精确 细 分 | 增强 黏 性 | 提高 忠诚 ”| ”体系 建设 ， 体系 建设 
1 lh 1 
| | | | 
外 1 1 


图 43 产品 生命 周期 图 


引入 期 : 产品 从 设计 投产 到 投入 市 场 进 入 测试 阶段 。 产 品种 类 少 , 顾 客 
对 产品 不 够 了 解 , 除 少数 猎奇 心理 的 顾客 外 ,几乎 无 人 大 量 购买 该 产品 。 生 
产 者 为 扩大 销路 ,需要 投入 大 量 的 促销 费用 ,对 产品 进行 宣传 推广 ,而 由 于 生 
产 技术 的 限制 ,产品 生产 批量 小 成 本 高 ,导致 销售 价格 偏 高 。 
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成 长 期 : 产品 通过 试销 效果 良好 ,购买 者 逐渐 接受 该 产品 ,进入 需求 增 
长 阶段 。 此 时 ,竞争 者 看 到 有 利 可 图 ,纷纷 进入 市 场 参与 竞争 ,使 同类 产品 供 
给 量 增加 ,价格 随 之 下 降 。 

成 熟 期 : 产品 走 入 大 批量 生产 并 稳定 进入 市 场 销 售 , 购 买 人 数 增多 ,市 
场 需求 趋 于 饱和 。 

衰退 期 : 产品 进入 淘汰 阶段 , 随 着 消费 习惯 的 改变 ,产品 销售 量 和 利润 
持续 下 降 ,市 场 逐渐 出 现 其 他 性 能 更 好 、 价 格 更 低 的 新 产品 ,以 满足 消费 者 新 
的 需求 。 旧 产品 无 利 可 图 , 撤 出 市 场 。 

根据 产品 所 处 生命 周期 .产品 的 市 场 竞争 状况 .产品 的 成 本 结构 等 因素 ， 
传统 的 市 场 营销 学 有 几 种 经 典 的 定价 方法 , 即 成 本 导向 定价 法 、 需 求 导向 定 
价 法 .竞争 定价 法 等 。 

成 本 导向 定价 法 

商品 定价 的 第 一 步 , 一 般 是 计算 成 本 ,对 于 普通 的 大 众 消 费 品 , 先 计 算 产 
品 的 原材料 成 本 ,再 加 上 广告 推广 成 本 ,以 及 人 工 、 房 租 .水 电 等 运营 成 本 ,得 
到 单个 产品 的 成 本 。 成 本 导向 定价 法 由 分 为 成 本 加 成 ,边际 成 本 、 目 标 利润 
种 。 

(1) 成 本 加 成 : 在 总 成 本 的 基础 上 ,加 上 一 定 百分比 的 加 成 ,制定 出 产 
品 的 销售 价格 。 

(2) 边际 成 本 : 企业 定价 时 ,只 考虑 变动 成 本 , 抛 开 固定 成 本 ,而 以 预期 
的 边际 贡献 适当 补偿 国定 成 本 。 边 际 贡 献 是 指 预期 的 销售 收入 减 去 变动 成 
本 后 的 收益 。 

(3) 目标 利润 : 根据 企业 的 总 成 本 和 估计 的 总 销售 量 ,确定 一 个 目标 收 

其 中 ,第 (1) 种 方法 中 渠道 商 和 零售 商用 得 较 多 ,另外 两 种 品牌 商 或 工厂 

么 的 都 有 人 使 用 。 例 如 ,出 版 社 出 版 图 书 的 成 本 就 非常 复杂 ,固定 成 本 有 


人 
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初稿 的 排版 、 制 表 、 制 图 等 ,印刷 成 本 有 印刷 、 纸 张 . 装 订 等 ,此 外 ,还 有 营销 、 
设计 、 库 存 等 间接 成 本 ,所 以 ,大 部 分 出 版 社 图 书 的 定价 往往 采用 生产 成 本 的 
加 成 方法 。 

需求 导向 定价 法 

企业 在 定价 时 ,不 再 以 成 本 为 基础 ,而 以 消费 者 对 产品 价值 的 理解 和 需 
求 强度 为 依据 。 需 求 定价 又 可 以 基于 理解 价值 的 定价 和 基于 需求 差异 的 
定价 。 

(1) 理解 价值 : 以 消费 者 对 商品 价值 的 感受 和 理解 程度 作为 定价 的 基 
本 依据 。 把 买方 的 价值 判断 与 卖方 的 成 本 费用 相 比 较 , 定 价 时 更 应 侧重 考虑 
前 者 。 

(2) 需求 差异 : 以 不 同时 间 、 地 点 .商品 以 及 不 同 消费 者 的 消费 需求 强 
度 差异 为 定价 的 基本 依据 ,针对 每 种 差异 决定 其 在 基础 价格 上 增加 还 是 减少 
价格 。 

我 国 的 快递 行业 目前 竞争 非常 激烈 ,在 电 商 异军突起 的 几 年 中 ,伴随 大 
量 订单 产生 了 剧 增 的 物流 需求 ,相应 地 ,整个 行业 的 基础 定价 也 水 涨 船 高 。 
由 浙江 杭州 桐庐 县 人 创立 的 “四 通 一 达 ”( 申 通 快递 .圆通 速递 .中 通 快 递 、 百 
世 汇 通 、 韵 达 快 递 ) 在 2014 年 11 月 开始 涨 价 ,平均 涨幅 1.5 一 2 元 / 单 , 接 着 ， 
几 家 公司 在 官网 上 发 出 声明 ,声称 此 次 涨 价 原因 是 燃油 价格 上 调和 人 工 成 本 
增加 。 实 际 上 ,油价 和 人 工 费 只 是 涨 价 的 诱因 ,真正 的 驱动 力 是 市 场 需求 的 
变化 。 中 国 快递 业务 量 增长 有 80% 来 自 电 商 , 而 快递 是 连接 电 商 和 消费 者 
的 最 后 一 公里 ,由 于 服务 同 质 化 严重 ,在 需求 增长 的 最 初 阶段 ,不 得 不 大 打 价 
格 战 , 而 企业 依靠 价格 战 并 非 长 久之 计 。 这 五 家 公司 均 由 浙江 杭州 桐庐 县 人 
创立 , 且 创 始 人 都 来 自 该 县 钟 山 乡 几 个 相 邻 的 村 庄 , 有 人 戏称 "桐庐 一 个 地 方 
120 万 人 ,80 万 在 干 快递 *。 这 些 同根 同 源 的 快递 公司 ,在 占据 市 场 垄 断 地 位 
后 , 面 对 依 然 持 续 增长 的 用 户 需求 和 加 速 上 涨 的 成 本 ,共同 上 调价 格 也 就 不 
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难 理 解 了 。 

竞争 导向 定价 法 

竞争 导向 定价 法 适用 于 价格 敏感 度 高 的 商品 ,以 市 场 上 相互 竞争 的 同类 
商品 价格 为 定价 基本 依据 ,根据 竞争 状况 的 变化 确定 和 调整 价格 水 平 ,与 竞 
争 商品 价格 保持 一 定 的 比例 ,而 不 过 多 考虑 成 本 及 市 场 需求 因素 。 

世界 上 最 大 的 工程 机 械 设备 生产 商 、 成 立 于 1925 年 的 美国 卡特 比 勒 公 
司 , 对 于 窑 引 机 的 定价 方法 就 十 分 奇特 。 一 般 率 引 机 的 价格 均 在 20 000 美 
元 左右 ,然而 该 公司 却 报价 24 000 美元 ,每 台 比 同类 产品 高 4000 美元 , 即 
20% ,但 它 的 销路 却 很 好 ,为 什么 呢 ? 原来 它们 有 一 套 说 服 人 的 账单 : 20 000 
美元 是 与 竞争 者 同一 型 号 的 机 器 价格 ,5000 美元 是 产品 更 耐用 而 必须 多 付 
的 价格 ,3000 美元 是 保修 期 更 长 多 付 的 价格 ,合计 价格 是 28 000 美元 ,如 果 
把 折扣 定 为 4000 美元 ,这 样 24 000 美元 就 是 最 后 的 价格 。 这 样 一 算 , 加 深 
了 客户 对 该 公司 产品 性 能 价格 比 的 理解 ,还 使 得 众多 消费 者 自己 宁愿 多 付 
4000 美元 ,结果 卡特 比 勤 公 司 的 牵引 机 在 市 场 上 十 分 畅销 。 在 这 个 报价 过 
程 中 ,卡特 比 勒 公 司 就 充分 感知 了 消费 者 对 商品 价值 的 感受 和 理解 程度 ,并 
且 参 考 竞 争 对 手 的 价格 合理 定位 。 

竞争 导向 定价 法 还 可 分 为 以 下 几 类 。 

(1) 通行 价格 : 使 零售 店 商 品 的 价格 与 竞争 者 商品 的 平均 价格 保持 
一 至。 

(2) 主动 竞争 : 不 追随 竞争 者 的 价格 ,而 是 根据 零售 店 商品 的 实际 情况 
以 及 与 竞争 对 手 的 商品 差异 情况 来 确定 。 

(3) 密封 投标 : 主要 用 于 投标 交易 ,投标 价格 是 零售 店 根据 对 竞争 者 的 
报价 估计 确定 的 ,而 不 是 按 零 售 店 自己 的 成 本 费用 或 市 场 需求 来 制定 的 。 当 
商场 位 置 好 产品 和 稀缺、 优先 上 市 .品牌 形 象 和 信誉 度 高 于 对 手 时 ,可 以 考虑 
定价 高 于 竞争 对 手 , 虽 然 制 定 更 低 的 价格 容易 吸引 客流 ,但 可 能 会 导致 恶意 
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党 争 s 


现实 生活 中 ,商品 定价 要 受到 各 种 因素 的 影响 ,除了 传统 的 成 本 导向 、 需 
求 导 向 竞争 导向 以 外 ,在 具体 的 情景 中 ,还 会 有 创新 的 组 合 模 式 , 例 如 : 


。 捆绑 销售 : 商品 组 合 定价 ,竞争 对 手 很 难 模仿 ; 


。 支付 方式 定价 : 通过 支付 方式 不 同 获得 不 同 的 价格 或 折扣 ,例如 银行 
卡 与 现金 ,通常 支付 现金 会 更 便宜 ,因为 银行 卡 需 要 付 给 银行 手 


续费 ; 


。 短期 特价 法 : 利用 价格 弹性 大 的 商品 短期 降价 ,价格 在 高 - 低 -高 波 


动 , 从 而 刺激 消费 者 的 消费 欲望 ; 


。 数字 游戏 定价 法 : 有 尾数 法 (例如 9.99 元 、1999 元 等 ) . 奇 /偶数 定价 

法 (这 种 方法 更 多 是 为 了 造成 视觉 冲击 ,例如 777、888、999) 等 ; 

。 拍卖 定价 法 : 主要 用 于 古玩 交易 、 土 地 交易 等 大 宗 商 品 交 易 中 。 
直到 今天 ,企业 在 定价 过 程 中 依然 需要 不 断 地 结合 传统 的 定价 方法 与 策 
略 ,进行 策略 组 合 , 这 些 方法 并 不 新 鲜 。 然 而 ,用 传统 的 价格 调节 手段 ,其 调 
节 过 程 通常 都 会 花费 较 长 时 间 。 随 着 数据 经 济 的 发 展 和 计算 能 力 的 变革 , 商 
品 的 供给 和 需求 相 比 以 往 发 生 着 更 加 剧烈 的 变化 ,价格 不 再 仅仅 由 商品 属性 
或 行业 特性 决定 ,而 是 与 时 间 和 空间 需求 息息相关 ,这 时 ,传统 定价 策略 已 经 
无 法 满足 赛 博 新 经 济 中 的 需求 的 剧烈 变化 。 那 么 动态 定价 算法 该 如 何 解 决 


这 些 问题 呢 ? 


动态 定价 的 算法 基础 


赛 博 新 经 济 带 来 的 最 大 变化 是 大 数据 和 机 器 学 习 算法 。 没 有 在 线 数据 
的 时 候 ,价格 的 变化 依赖 假设 模型 ,大 部 分 时 候 是 拍 脑袋 决定 的 ,多 次 试 错 后 


才能 找到 合适 的 价格 ,每 次 试验 的 真实 数据 需要 上 一 次 试验 得 出 
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馈 机 制 比较 长 .收敛 慢 、 试 错 成 本 高 。 有 了 在 线 数据 以 后 ,动态 定价 算法 可 以 
实时 测验 。 同 时 ,计算 能 力 的 增强 ,可 以 辅助 算法 更 精准 高 效 地 挖掘 合理 的 
价格 ,把 算法 迁移 到 不 同 的 应 用 场景 中 ,通过 动态 调节 商品 价格 促使 其 回归 
价值 ,进而 推动 各 行 各 业 的 市 场 秩序 趋 于 理性 。 所 以 ,动态 定价 作为 一 种 强 
有 力 的 价格 调节 机 制 , 其 策略 空间 非常 大 。 

以 赛 博 经 济 中 的 平台 型 企业 滴 滴 公 司 出 行为 例 ,我 们 可 以 归纳 出 一 般 的 
动态 定价 机 制 。 如 图 4.4 所 示 , 滴 滴 出 行 周期 性 地 收集 实时 乘 车 数据 ,集合 
自身 运力 进行 预测 和 匹配 ,在 运营 过 程 中 不 断 反 馈 与 迭代 ,进而 再 次 发 现 
价格 。 


周期 性 收集 数据 | 包括 实时 需求 数据 和 历史 分 析 数 据 


慰 预测 ， 给 受 
需求 匹配 人 定 双方 可 接受 的 


区 


间 ， 如 车 队 的 


预测 未 来 某 个 时 刻 的 价格 变化 ， 反 过 来 调整 现在 的 供给 
反例 过 代 | 强人 格 ， 例 如 出 租车 运力 不 名 的 话 ， 有 此 对 客 训 全 


发 现价 格 的 核心 影响 因素 ， 反 复 训 练 各 种 信息 的 权重 
机 器 学 习 以 提高 我 们 的 价格 提示 ， 得 到 可 以 自学 习 的 价格 模型 
通过 市 场 发 现价 格 


图 44 动态 定价 机 制 流程 图 


人 工 智能 算法 的 进步 使 得 动态 定价 的 算法 也 越 来 越 智能 ,借助 机 器 学 习 
算法 ,动态 定价 算法 甚至 也 可 以 自我 学 习 和 实时 修正 。 
目前 ,人 工 智能 (AD 已 成 为 全 球 IT 巨头 最 新 的 角 斗 场 。 谷 歌 公司 旗下 
的 AI 科技 公司 DeepMind 去 年 推出 AlphaGo, 相 继 战 胜 人 类 顶尖 棋 手 李 世 
石和 柯 洁 , 不 禁 让 我 们 联想 起 几 年 前 IBM 公司 旗下 的 云端 AI 计算 机 沃 森 赢 
得 了 美国 电视 智力 竞猜 节目 (危险 边缘 ) 特 别 版 的 冠军 ,击败 美国 竞猜 节目 中 
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最 聪明 的 人 脑 。DeepMind 和 沃 森 与 人 类 的 较量 ,把 人 工 智能 的 应 用 推 向 各 
个 领域 ,开启 了 对 大 数据 分 析 背 后 的 知识 与 洞察 的 争夺 战 , 也 将 “深度 学 习 ” 
变 得 广为人知 。 而 深度 学 习 需 要 的 两 样 东西 , 正 是 海量 的 计量 处 理 能 力 和 海 
量 的 可 学 习 数 据 。 沃 森 背 后 依赖 的 是 被 IBM 称 之 为 “ 认 知 计算 ”的 基本 原 
理 , 其 核心 也 正 是 机 器 学 习 算法 。 

下 面 让 我 们 先 看 一 下 动态 定价 中 供需 双方 的 交易 点 最 后 应 该 处 于 什么 
位 置 。 


动态 调整 价格 的 理论 预期 值 一 一 纳什 讨价还价 解 


设计 一 个 动态 算法 ,首先 还 是 要 从 作为 讨价还价 的 买卖 双方 的 博弈 开 

。 我 们 与 小 商贩 讨价还价 ,是 一 种 最 为 原始 的 动态 定价 行为 , 它 的 历史 可 
以 追溯 到 原始 的 商品 交换 时 期 。 在 没有 经 济 统计 数据 ,技术 不 发 达 的 年 代 ， 
商品 交换 以 一 种 原始 的 方式 进行 着 , 那 就 是 在 街头 埠 陌 的 市 场 中 ,商贩 与 消 
费 者 讨价还价 。 这 个 过 程 是 分 两 步 完 成 的 : 首先 是 双方 沟通 议价 ,通过 交谈 
的 方式 将 买方 和 卖方 对 于 此 笔 交 易 的 心理 预期 和 市 场 定价 等 一 系列 交易 信 
息 进 行 交流 ,并 且 通 过 不 断 地 调整 定价 策略 来 达到 符合 自己 意愿 的 交易 价 
格 。 最 后 是 成 交 , 双 方 根据 之 前 的 协商 定价 完成 交易 

讨价还价 涉及 一 个 大 众 心理 问题 ,价格 需 进 行 讨 价 还 价 的 博弈 互动 才能 
达成 ,这 种 博弈 , 曾 因 纳什 的 贡献 而 被 称 为 “纳什 讨价还价 ”, 双 方 通过 讨 价 还 
价 达 成 的 一 致 价格 , 称 为 纳什 讨价还价 解 。 

通常 ,在 参与 交易 的 双方 中 ,卖方 有 一 个 心理 预期 最 低 值 , 买 方 有 一 个 心 
理 预 期 最 高 值 ,买方 的 最 高 值 应 该 高 于 卖方 的 最 低 值 ,否则 交易 无 法 达成 ,而 
在 买方 的 最 高 值 和 卖方 的 最 低 值 之 间 的 任何 一 点 上 都 可 能 实现 成 交 。 在 赛 
博 新 经 济 时 代 ,我 们 可 以 通过 人 工 智能 和 大 数据 了 解 供给 能 力 ,同时 预测 需 
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求情 况 , 这 样 在 动态 定价 的 设计 上 ,就 可 以 让 双方 更 加 快速 地 达到 纳什 讨 价 
还 价 解 这 一 交易 点 。 下 面 我 们 对 以 纳什 命名 的 这 一 博弈 过 程 做 简单 介绍 ,了 
解 双方 达到 交易 的 价格 点 在 哪里 。 

假设 有 两 个 人 分 一 大 碗 冰淇淋 , 甲 先 出 价 ( 这 里 的 出 价 实际 上 是 指 冰 
激 凌 的 分 配方 案 ,也 就 是 甲 和 乙 分 别 占 多 少 份额 ), 如 果 乙 接受 ,冰淇淋 按 
甲 的 方案 进行 分 配 。 如 果 乙 拒绝 ,他 将 还 价 , 甲 可 以 接受 或 拒绝 。 如 果 甲 
接受 ,博弈 结束 ,冰激凌 按 乙 的 方案 分 配 。 如 果 甲 拒绝 ,他 再 出 价 。 如 此 来 
出 价 , 直 到 一 方 的 出 价 被 男 一 方 接受 。 这 些 你 来 我 往 的 过 程 可 以 看 作 是 
一 个 无 限 次 完美 信息 博弈 ,这 里 的 完美 信息 指 的 是 双方 都 没有 任何 隐藏 信 
息 。 第 一 个 参与 人 在 时 间 点 1、3、5、…… 出 价 ,第 二 个 参与 人 在 时 间 点 2、 
4.6、…… 出 价 。 但 是 请 注意 ,天 气 很 热 , 伴 随 着 每 轮 议价 ,冰激凌 会 不 断 融 
化 ,从 而 价值 越 来 越 小 ,反映 在 价格 上 也 会 有 所 降低 。 也 就 是 说 ,价值 在 不 
断 缩水 ,在 经 济 学 中 ,用 贴现 因子 来 表示 这 种 价值 缩水 的 过 程 , 贴 现 因 子 通 
常 是 一 个 小 于 1 的 数 ,表示 价值 在 不 断 减少 。 为 了 准确 计算 出 最 终 交 易 时 
冰激凌 的 价值 在 前 面 每 一 轮 议价 时 值 多 少 钱 , 可 以 假设 甲乙 的 贴现 因子 
分 别 为 6 和 8。 

假如 ,我 们 用 X 表示 甲 的 份额 ,1 一 X 为 乙 的 份额 ,那么 ,X; 和 1 一 X; 分 
别 是 时 间 点 i 时 甲乙 各 自 所 得 的 份额 。 这 里 需要 知道 甲乙 未 来 所 得 的 份额 
折算 到 当下 的 价值 ,前 面 设 定 了 贴现 因子 分 别 是 和 8 ,那么 , 当 博弈 在 时 
间 点 zt 结束 时 , 甲 的 支付 贴现 值 为 Wi 二 001X,, 乙 的 支付 贴现 值 为 W = 
6 1X,。 两 者 在 无 限 次 讨价还价 之 后 ,双方 终于 就 某 一 价格 达成 一 致意 见 ， 
即 最 终 得 到 的 均衡 解 为 : 


回 


,1—6, 
1 一 22 


这 就 是 纳什 讨价还价 解 , 其 意义 在 于 当 双 方 都 知道 纳什 讨价还价 解 
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存在 时 ,实际 上 甲 方 第 一 次 出 价 时 就 会 按照 均衡 解 直接 给 出 建议 ,乙方 
接受 ,博弈 过 程 结束 ,并 不 需要 真 的 重复 无 限 次 ,这 样 至 少 能 保证 冰激凌 
大 体 完 整 。 

在 经 济 学 中 ,讨价还价 模型 可 以 应 用 到 很 多 场景 中 ,最 经 典 的 就 是 商业 
谈判 。 原 本 的 数学 模型 是 以 冰激凌 作为 整体 进行 考虑 ,现在 可 以 把 企业 甲 和 
企业 乙 谈 判 过 程 中 ,出 的 最 低 价 “ 与 出 的 最 高 价 和 组 成 一 个 区 间 , 而 议价 过 
程 中 的 每 一 个 价格 都 会 落 到 [a, 5] 中 来 ,事实 上 ,谈判 的 双方 就 是 在 这 一 区 
间 上 出 价 议价 的 。 经 过 谈判 ,双方 会 在 价格 c 处 成 交 ,而 c 一 定 处 在 a 与 6 之 
间 。 由 此 ,我 们 可 以 得 到 新 的 纳什 讨价还价 解 。 


人 1 一 2)( 一 4) 
1 一 0 


下 面 可 以 看 一 下 这 个 算法 如 何在 市 场 中 应 用 。 假 设 公 司 甲 为 了 改善 培 
训 课程 的 排 课 体系 ,并 且 培 养 学 生 们 的 自主 规划 能 力 , 拟 收购 公司 乙 , 但 是 对 
于 初创 企业 ,市场 并 没有 一 个 合适 的 公允 价格 ,于 是 两 家 公司 进行 并 购 谈判 。 
经 过 资产 评估 ,课程 格子 的 净 资 产 为 100 万 元 ,根据 当时 市 场 状况 及 商 誉 等 
情况 ,公司 乙 CEO 决定 出 价 130 万 元 ,但 是 ,公司 甲 认为 其 价值 只 有 110 万 
元 ,于 是 还 价 110 万 元 。 这 里 公司 乙 先 出 价 , 公 司 甲 后 出 价 。 假 定 双方 的 贴 
现 因子 相同 , 均 为 0. 9, 根 据 模 型 ,可 以 计算 出 双方 谈判 的 均衡 结果 X 为 
120. 53 万 元 ,它们 最 终 会 以 这 个 价格 交易 。 

然而 ,这 是 根据 公式 计算 出 来 的 理想 均衡 结果 ,双方 的 成 交 价格 还 存在 
许多 客观 或 主观 因素 ,不 一 定 等 于 X ,例如 ,如 果 公 司 两 此 时 也 对 公司 乙 有 
兴趣 ,于 是 抬 高 市 场 价格 ,或 者 公司 甲 内 部 有 一 款 类 似 软件 ,可 取代 公司 乙 的 
部 分 功能 ,并 不 需要 全 资 收购 ,这 些 都 会 影响 最 后 的 成 交 结果 。 但 是 ,这 个 经 
模型 无 疑 对 未 来 的 成 交 价格 具有 重要 参考 作用 。 


区 考 遂 
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动态 定价 在 新 经 济 领 域 的 应 用 


策略 性 思维 是 在 不 断 弄 清 对 手 的 过 程 中 ,战胜 对 手 的 一 门 艺术 。 
一 一 埃 维 纳什 。 迪 克 西 ,《 策 略 性 思考 》 


机 票 价格 到 底 是 如 何 制定 的 


航空 公司 飞行 线路 图 错综复杂 ,我们 日 常 乘坐 飞机 的 交通 成 本 往往 是 旅 
行 费 中 的 “大 头 ”, 但 人 们 常常 发 现 机 票 价格 变化 随机 得 令 人 摸 不 着 头脑 ,有 
时 高 得 离谱 ,有 时 突然 大 幅 打折 ,长 途 机 票 经 常 比 短途 机 票 还 便宜 。CNN 有 
过 一 次 相关 报道 ,这 些 看 似 无 序 的 现象 背后 ,其 实 是 有 规律 的 。 为 了 实现 收 
入 最 大 化 的 目标 ,航空 公司 往往 实时 动态 地 调整 票 价 ,这 种 方法 称 为 航空 公 
司 收益 管理 。 它 们 不 仅 会 参考 成 本 、 供 给 与 需求 等 方面 ,还 会 利用 先进 的 软 
件 ,将 公司 的 全 球 航线 布局 .乘客 个 人 偏好 等 因素 考虑 进来 ,以 实现 科学 
定价 。 


航空 公司 定制 个 性 化 价格 


历史 上 的 大 多 数 时 期 ,航空 公司 处 于 严格 监管 之 下 ,国际 航线 通常 由 相 
关 国家 的 国有 航空 公司 运营 ,几乎 不 存在 市 场 竞争 , 买 机 票 往往 需要 一 笔 巨 
款 。 打 折 机 票 并 非 不 存在 ,但 通常 有 很 多 严 苟 的 附加 条 件 。1978 年 ,在 全 球 
贸易 自由 化 趋势 下 ,美国 出 台 法 案 放松 对 航空 业 的 管制 ,于 是 ,产业 结构 和 票 
价 也 发 生 了 很 大 变化 。 网 络 的 发 展 与 计算 机 成 本 下 降 , 使 收益 管理 的 先进 性 


U 


129 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


达到 了 全 新 水 平 ,航空 公司 的 收益 管理 也 变 得 竞争 激烈 而 日 益 复杂 。 

人 们 都 知道 经 济 舱 .商务 舱 和 头等 舱 的 票 价 不 同 ,但 其 实 , 航 空 公司 把 机 
上 的 座位 细 分 成 了 几 十 个 部 分 ,并 根据 机 票 售 出 情况 随时 调整 每 个 类 别 的 座 
位 数量 。CNN 称 , 航 空 公司 的 终极 目标 是 了 解 客户 ,并 提供 完全 个 性 化 的 定 
价 服务 ,“ 例 如 ,伦敦 到 马 略 卡 岛 的 航线 明显 是 度假 休闲 路 线 , 航 空 公 司 假设 
旅客 会 提前 几 个 月 订 票 ,那么 这 条 航线 的 机 票 一 开始 会 相对 定价 较 高 ,然后 
根据 市 场 反 应 进行 调整 。 而 对 于 伦敦 到 法 兰 克 福 这 样 的 典型 商务 航线 ,航空 
公司 一 开始 可 能 以 低 价 确保 机 票 能 够 售 出 ,然后 在 起 飞 前 最 后 的 时 段 里 大 幅 
提高 票 价 , 将 机 票 卖 给 刚性 需求 的 客户 ”此 外 ,航空 公司 收益 管理 系统 不 仅 
考虑 机 票 本 身 ,也 越 来 越 多 地 考虑 旅客 可 能 带 来 的 辅助 收入 ,这 将 成 为 日 益 
增长 的 利润 来 源 。 

为 了 与 廉价 航空 公司 争夺 客 源 ,美国 联合 航空 公司 曾 推出 比 经 济 舱 更 便 
宜 的 特价 机 票 , 购 买 这 种 机 票 的 乘客 可 以 享受 到 与 普通 经 济 舱 乘客 同样 的 食 
品 \ 饮 料 、 娱 乐 和 无 线 网 络 服务 ,但 在 航班 起 飞 当 天 才能 分 配 座 位 、 最 后 登 机 ， 
且 只 能 携带 背包 、 电 脑 包 等 能 放 在 座位 下 方 的 个 人 物品 。《 纽 约 时 报 》 称 ,有 
些 乘 客 只 想 安 全 到 达 目 的 地 ,并 愿意 为 更 优惠 的 价格 放弃 一 些 服 务 , 航 空 公 
司 则 允许 乘客 在 购买 廉价 机 票 的 基础 上 多 花 一 些 费用 ,获得 额外 的 服务 ,如 
行李 托运 ,更 宽敞 的 座位 等 。 如 果 航 班 在 起 飞 前 仍 有 空位 ,将 其 低 价 售 出 是 
不 小 的 诱惑 ,但 航空 公司 需要 考虑 机 票 价格 与 品牌 和 长 期 业务 之 间 的 微妙 平 
衡 。 如 果 起 飞 前 总 有 低 价 票 放 出 ,就 会 严重 损害 公司 品牌 ,导致 高 附加 值 乘 
客流 失 ,商务 舱 乘 客 也 可 能 不 愿 再 购买 全 价 票 , 因 为 他 们 知道 有 机 会 在 最 后 
关头 以 很 低 的 价格 升 舱 。 为 此 ,以 色 列 的 Bidflyer、 美 国 的 Plusgrade、 澳 大 利 
亚 的 SeatFrog 等 创业 公司 纷纷 推出 航空 竞价 软件 ,航空 公司 可 通过 拍卖 将 
升 舱 服务 卖 给 出 价 最 高 的 乘客 ,并 以 此 了 解 乘客 愿意 为 额外 服务 支付 多 


少 钱 。 
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买 机 票 将 成 为 机 器 人 大 战 


虽然 机 票 定价 有 规律 可 循 ,但 对 许多 乘客 来 说 ,价格 波动 得 如 此 随机 仍 
令 人 感到 焦虑 ,他 们 担心 买 不 到 价格 最 优惠 的 机 票 , 甚 至 被 “ 字 ”。 航 空 公司 
有 一 系列 策略 来 增加 收入 ,旅客 也 有 自己 的 对 策 。 据 CNN 报道 ,美国 优惠 
机 票 预订 应 用 Skyscanner、Kayak 等 ,可 以 帮助 旅客 搜索 超过 1000 家 航空 公 
司 的 上 百 万 条 航线 ,并 在 几 秒 钟 内 找到 价格 更 低 的 航班 ,同时 为 旅客 实时 监 
控 特 定 航班 的 票 价 情况 并 发 出 提醒 。 据 “美国 之 音 ” 电 台 网 站 报道 ,与 以 往 的 
机 票 垂直 搜索 和 比价 网 站 不 同 ,凭借 独 有 的 票 价 预 测 技 术 , 美 国 加 州 FLYR 
公司 不 仅 承诺 帮助 旅客 在 最 佳 时 刻 预订 价格 最 低 的 机 票 , 还 与 TripAdvisor 
合作 推出 了 “锁定 票 价 ”服务 。 用 户 在 该 网 站 上 选择 航班 后 ,FLYR 将 在 7 天 
内 确保 他 们 预订 的 票 价 不 受 价格 增长 的 影响 ,如 果 用 户 在 7 天 内 搜索 到 了 更 
合适 的 票 价 , 变 更 选择 也 不 需要 额外 缴纳 费用 。 

“根据 大 量 的 数据 资源 ,我 们 可 以 准确 地 预测 机 票 价格 波动 的 可 能 性 ,为 
旅客 提出 最 佳 出 行 方案 。 如 果 我 们 认为 票 价 将 在 不 久 的 将 来 下 跌 , 会 建议 乘 
客 等 待 一 段 时 间 。”FLYR 创始 人 、 荷 兰 企业 家 Alexander Mans 告诉 CNN， 
在 航班 出 发 前 30 天 ,机 票 价格 有 60%~~70% 的 概率 下 调 。Hopper 是 男 一 家 
专业 的 机 票 价格 预测 公司 , 它 使 用 大 数据 提前 12 个 月 预测 票 价 ,其 手机 应 上 
程序 已 被 下 载 超过 800 万 次 。“ 我 们 的 系统 每 天 监控 60 亿 到 80 亿 张 机 票 ， 
我 们 的 数据 库 有 过 去 5 年 的 历史 票 价 .”Hopper 创始 人 兼 CEO Frederic 
Lalonde 自豪 地 称 , 他 们 的 算法 能 在 航班 出 发 6 个 月 前 准确 预测 机 票 价格 , 误 
差 不 超 过 5 美元 ,准确 度 高 达 95% 。 大 数据 和 人 工 智 能 技术 的 发 展 , 有 望 成 
为 机 票 定价 领域 的 主流 ,未 来 购买 机 票 将 是 一 场 “机 器 人 大 战 ?。 这 并 不 是 坏 
消息 , 它 可 能 为 旅客 带 来 更 好 的 选择 和 更 有 效 的 预订 流程 。 
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Uber 的 动态 定价 策略 


在 2016 年 CES 国际 消费 类 电子 产品 展览 会 期 间 ,Uber、Lyft 等 打车 应 
用 也 悄然 在 美国 拉 斯 维 加 斯 所 在 的 内 华 达 州 下 调 了 其 服务 价格 ,助力 CES。 
在 CES 举办 之 前 的 2015 年 12 月 8 日 ,Uber 就 已 经 将 其 在 内 华 达 州 的 打车 
价格 下 调 , 并 且 不 再 上 涨 ,整体 价格 已 低 于 当地 的 出 租车 行情 。 随 后 , Uber 
的 竞争 对 手 Lyft 也 效仿 其 降价 方法 ,并 且 Lyft 发 言 人 赛 利 亚 : 布雷 森 还 表 
示 , 在 CES 期 间 不 会 上 调 高 峰 期 200% 的 涨 价 上 限 。 与 此 同时 ,Uber 还 联合 
车 载 设备 厂商 Vinli 以 及 无 线 运 营 商 T-Mobile, 在 CES 展会 期 间 面向 当地 乘 
客 提供 Wi-Fi 服务 。 虽 然 这 些 举 措 是 Uber 在 CES 着 力 推 介 自 己 的 行动 , 却 
为 CES 展期 间 的 交通 调度 带 来 了 便利 。 

现在 已 经 被 滴 滴 出 行 收购 的 Uber 中 国 ,在 最 开始 进入 中 国 市 场 时 ， 
便 加 入 了 出 行 补贴 的 战局 ,而 与 国内 打车 公司 不 同 , 动 态 定价 策略 一 直 
是 其 核心 策略 之 一 ,虽然 那些 对 价格 敏感 的 消费 者 对 此 并 不 满意 ,但 这 
不 但 不 会 影响 Uber 的 销售 ,反而 这 种 符合 实时 供求 关系 的 溢价 算法 提 
高 了 Uber 的 整体 收入 。 正 如 他 们 自己 所 说 “溢价 不 是 计划 好 的 ,是 依据 


Uber 的 峰 时 价格 调整 策略 


2012 年 初 ,Uber 位 于 波士顿 的 研究 组 发 现 ,每 到 周 五 和 周 六 凌晨 1 点 左 
右 ,会 出 现 大 量 的 “未 满足 需求 "。 导致 这 种 现象 的 原因 是 在 这 个 时 段 ,大 部 
分 司机 退出 Uber 系统 ,准备 收工 回 家 ,而 恰恰 这 会 很 多 人 刚 准备 回 家 ,造成 
了 瞬间 的 供需 不 平衡 ,在 最 需要 用 车 的 时 候 却 叫 不 到 车 ,用 户 的 抱怨 与 日 俱 
增 。 于 是 Uber 设计 了 一 个 方案 ,在 高 峰 期 (午夜 到 凌晨 3 点 ) 适 当 提高 每 次 
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乘坐 的 单价 ,看 是 否 能 吸引 更 多 司机 。 仅 仅 两 周 后 ,他 们 就 得 到 了 非常 好 的 
反馈 ,在 该 时 段 的 提 价 ,使 得 服务 车 辆 的 供应 量 增 加 了 70% ~80%, 几乎 满 
足 了 三 分 之 二 的 “未 满足 需求 ”, 这 绝对 是 个 重大 突破 。 看 来 在 出 行 领域 ,由 
于 供应 量 的 弹性 非常 大 ,在 市 场 价格 调 高 后 ,司机 确实 更 有 动力 守候 在 午夜 
时 分 。 

这 个 调查 成 功 开 启 了 Uber 的 动态 定价 策略 ,随后 动态 定价 便 正式 应 上 
在 所 有 高 峰 时 段 。Uber 动态 定价 的 算法 也 十 分 智能 , 当 用 户 等 待 时 间 的 上 
升 趋势 比较 陡峭 时 , 便 会 触发 该 算法 。 其 实 , 这 里 采用 的 动态 定价 核心 想法 
很 简单 ,要 解决 供求 不 平衡 ,要 么 增加 供给 ,要 么 减少 需求 。 动 态 定价 则 成 功 
地 从 这 两 个 方面 影响 了 供求 关系 。 

供求 曲线 模型 是 经 济 学 最 基础 和 最 核心 的 模型 。 要 分 析 , 就 要 根据 
Uber 的 业务 模式 来 确定 其 供求 。 图 4.5 给 出 了 供给 与 需求 的 关联 模型 。 


Price 


Supply curve. 


Market price 


Equilibrium quantity Quantity 


图 45 供给 与 需求 模型 


首先 ,如 上 文中 的 波士顿 实验 ,证 明 出 行 市 场 的 需求 和 供给 都 是 高 弹 
性 的 。 
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就 需求 方 而 言 ,在 两 个 方向 上 都 具备 高 度 弹性 。 其 一 , 当 价 格 升 高 后 , 直 
接 使 需求 量 相 应 减少 。 其 二 , 当 价 格 降低 后 ,需求 量 也 会 立即 增加 。 

市 场 化 在 Uber 的 业务 上 体现 得 非常 灵敏 “看 不 见 的 手 ” 将 资源 进行 最 
优化 的 配置 。 这 种 现象 并 不 难 解释 ,因为 在 Uber 这 个 市 场 里 的 参与 者 ,都 
是 独立 个 体 , 可 以 认为 是 “理性 人 ”, 所 以 他 们 的 行为 可 以 准确 地 被 市 场 规律 

Uber 动态 定价 模型 中 的 供求 关系 也 是 非常 直观 的 。 

当 需 求 大 于 供给 ,算法 会 自动 提高 价格 ,减少 需求 提高 供给 ,使 得 供需 
达到 一 个 动态 平衡 。 这 个 过 程 持续 不 了 多 久 , 因 为 当 供 给 逐渐 大 于 需求 
时 ,价格 又 会 恢复 到 初始 水 平 。 这 个 过 程 循环 往复 ,始终 维持 着 平衡 。 试 
想 如 果 需 求 增加 ,而 不 升 高 价格 ,会 发 生 什么 ? 用 户 等 了 好 久 都 没 叫 到 车 ， 
未 满足 需求 井喷 ,用 户 不 满意 ,将 卸载 其 软件 ,再 也 不 用 。 如 果 采 用 动态 定 
价 ,从 图 4.6 来 看 ,如 果 需 求 增加 (图 中 从 Di 到 D,) 或 者 供给 减少 (图 中 从 
Si 到 Ss), 当 然 也 可 能 同时 发 生 ,这 时 ,新 的 平衡 点 Q,。 和 Q 比 , 价 格 是 上 
升 的 。 


Price 


We 
') 
0,0 Quantity 


图 46 动态 定价 的 供需 分 析 
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Uber 与 酒店 .机票 .租车 


很 多 行业 都 在 比较 成 熟地 使 用 动态 定价 ,例如 酒店 .航空 公司 、 租 车 行 ， 
高 峰 期 也 与 Uber 类 似 , 尤 其 是 节假日 。 酒 店 在 新 年 夜 的 价格 往往 比 平时 或 
周末 都 要 高 出 一 两 倍 , 在 无 法 提高 供给 的 时 候 , 提 高 价格 也 是 能 被 大 众 所 接 

唯一 不 大 一 样 的 是 , 像 酒店 .机票 ,它们 的 供给 是 固定 的 ,无 法 提高 ,而 
Uber 不 同 。 对 酒店 来 说 ,供给 是 刚性 的 ,因为 无 法 临时 造 所 房子 出 来 ,而 
Uber 的 司机 供给 弹性 则 大 得 多 ,司机 可 以 收工 回 家 ,也 可 以 继续 服务 。 

大 家 知道 , 绝 大 多 数 运用 动态 定价 的 企业 是 有 库存 的 。 它 们 的 特点 是 
“有 限 .随时 间 消逝 ”, 即 一 趟 航班 的 座位 数 .一 个 酒店 的 房间 数 、 一 个 球场 或 
剧院 的 座位 数 都 是 固定 的 ,一 旦 飞机 起 飞 、 比 赛 开始 ,演出 拉 开 帷幕 ,时 间 过 
去 了 却 还 有 空 座 或 空房 ,那么 这 部 分 收入 也 就 永远 失去 了 ,因此 它们 要 尽 可 
能 快 地 售 清 库存 ,并 尽 可 能 多 地 从 需求 中 获取 利润 。 可 以 说 ,传统 的 动态 定 
价 都 是 通过 价格 的 变动 来 调整 需求 ,目标 是 适应 供给 ,或许 称 为 "基于 时 间 因 
素 的 差异 化 定价 策略 ”更 合适 。 

Uber 则 不 同 。Uber 不 拥有 任何 一 辆 车 ,也 无 法 强制 任何 一 个 司机 服 
务 , 但 任何 一 个 有 车 的 司机 都 有 可 能 安装 Uber 司机 端 软 件 , 换 句 话 说 ,Uber 
的 “库存 ?是 可 多 可 少 的 。 人 们 搭车 需求 最 强 的 时 刻 ,对 司机 来 说 往往 也 是 驾 
车 体验 不 甚 愉悦、 甚至 危险 系数 颇 高 的 时 刻 , 例 如 早晚 高 峰 、 有 暴雨 或 台风 的 
夜晚 。 在 这 些 情况 下 , 若 无 激励 机 制 ,上 线 服务 的 司机 数 即 供应 量 自然 就 会 
减少 。 因 此 ,使 Uber 定价 区 别 于 其 他 行业 做 法 的 特殊 之 处 ,不 在 于 它 限 制 
了 需求 ,而 在 于 它 调动 了 供给 。 以 前 想 打 车 也 付 得 起 车 费 却 无 车 可 打 的 人 ， 
现在 可 以 顺利 叫 到 车 了 。 最 终 的 结果 是 让 更 多 人 的 需求 得 到 了 满足 。 

对 Uber 来 说 ,在 需求 大 量 增加 时 ,供给 曲线 左 移 , 需 求 曲 线 右 移 ,这 时 
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需要 价格 作为 催化 剂 来 达成 二 者 的 平衡 。 影 响 供给 的 还 有 个 因素 ,就 是 可 奉 
代 性 如 何 。 新 年 夜 的 大 单干 载 难 着 ,有 的 用 户 会 预定 一 辆 车 来 独自 享受 , 价 
格 甚至 可 能 超过 1000 美金 一 晚 ,这 种 情况 下 ,有 些 在 家 里 无 事 可 做 的 司机 也 
是 会 很 乐意 出 来 接 一 单 的 。 

所 以 ,Uber 的 价格 ,实际 上 是 基于 “供需 关系 ”这 个 最 基本 的 逻辑 ,依靠 
动态 定价 算法 实时 计算 得 来 的 。 例 如 在 北京 五 道口 的 某 个 时 刻 , 当 前 有 100 
个 司机 和 100 个 乘客 ,供需 平衡 ,那么 采用 “基准 价 ” 就 可 以 了 。 过 了 半 小 时 ， 
100 个 司机 还 在 ,只 有 80 个 乘客 了 ,这 时 ,Uber 动态 定价 算法 就 开始 下 调 “ 基 
准 价 ”, 把 那些 本 来 准备 坐 地 铁 或 骑 共 享 单车 的 人 吸引 过 来 。 同 时 ,也 顺便 减 
少 一 点 供给 ,有 些 司机 认为 这 个 时 间 段 太 便宜 ,干脆 去 歇 一 会 算 了 。 两 个 小 
时 以 后 , 晚 高 峰 来 了 ,100 个 司机 没 变 ,有 150 个 乘客 了 ,算法 开始 自动 加 价 ， 
1.5 倍 .2.3 倍 .3.8 倍 不 断 上 涨 。 觉 得 贵 的 乘客 自然 会 去 骑 单车 ,价格 的 上 
涨 顺便 还 能 把 周边 等 活 的 Uber 司机 也 吸引 过 来 从 而 增加 供给 。 


最 具 挑 战 环节 : 附近 无 车 可 用 


关于 Uber 的 定价 ,媒体 与 论 也 吵 得 纷纷 扬扬 ,使 得 Uber 不 得 不 重新 考 
虑 其 加 价 条 款 。 越 来 越 多 的 用 户 抱怨 在 很 多 地 方 都 无 车 可 用 ,丝毫 不 实用 ， 
也 无 可 靠 性 。 最 差 的 一 种 体验 就 是 刚 打开 Uber, 就 提示 无 车 可 用 ,如 图 4.7 
所 示 。 有 人 说 ,至 少 应 该 在 没 车 可 用 时 保持 平价 ,好 站 在 用 户 这 一 方 ,抚慰 这 
些 没 打 到 车 的 人 。 其 实事 实 不 是 这 样 ,在 高 峰 期 ,任何 一 种 交通 工具 都 是 超 
负荷 运转 的 。 地 铁 、 公 交 都 是 这 样 ,都 无 法 提供 可 靠 的 服务 。 这 时 Uber 更 
倾向 于 让 更 多 的 用 户 能 够 叫 到 车 。 与 其 让 用 户 无 车 可 用 ,不 如 让 部 分 用 户 对 
定价 持 有 异议 似乎 更 容易 接受 。 

不 理解 Uber 动态 定价 的 用 户 , 其 实 是 没有 理解 Uber 作为 一 个 市 场 平 
台 的 本 质 。 主 流 的 平台 都 会 用 供需 模型 来 调整 供应 量 。 这 也 是 eBay 拍卖 最 
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初 的 做 法 。StubHub、Airbnb、Homeaway 也 
都 是 这 么 做 的 。Google Adwords 的 定价 算 
法 也 是 以 此 为 基础 。 正 是 动态 定价 在 市 场 
上 如 此 广泛 的 应 用 ,给 了 Uber 信心 。 最 大 
化 用 户 的 利益 ,最 优化 市 场 资源 的 配置 ,只 
能 通过 动态 定价 来 实现 ,即使 有 时 部 分 用 户 
会 很 不 理解 。 在 车 少 导致 打 不 到 车 的 情况 
下 ,大 家 在 心理 上 更 希望 把 打 到 车 的 人 归结 
为 “运气 好 ”, 而 不 是 “他 有 钱 ”, 而 且 在 极端 
天 气 到 来 的 时 候 提 高 价格 ,会 让 人 们 本 来 把 
对 某 个 司机 发 灾难 财 的 抱怨 转嫁 到 整个 公 
司 的 头 上 。 

Uber 对 经 济 学 原理 的 应 用 无 可 厚 非 , 供 


® UBER © 


PiomuP LOCATION 
555 FRANK ROAD 


图 47 Uber 客户 端 显 示 界面 


需 原理 也 的 确 能 够 发 挥 杠 杆 作 用 ,但 是 归根 到 底 ,在 算法 还 无 法 达到 真正 的 
智能 之 前 ,比如 即时 判断 车 变 少 的 原因 ,完全 依赖 于 大 数据 和 算法 总 是 会 让 


人 不 太 愉 悦 。 


Uber 的 定价 算法 基于 大 量 、 即 时 的 数据 进行 建 模 和 优化 ,引入 了 “时 间 - 
空间 ” 双 维 度 。 这 种 实时 性 ,赋予 了 司机 估算 需求 的 能 力 , 这 在 传统 出 租车 行 
业 是 无 法 实现 的 ,Uber 还 能 在 系统 给 出 的 建议 指导 下 ,识别 出 回报 率 最 高 的 


接客 时 间 和 地 点 。 此 外 ,不 同城 市 的 价格 弹性 各 不 相同 。 为 实现 对 每 个 城市 
的 “ 量 身 定制 ”",Uber 建立 了 大 规模 的 计量 经 济 模型 和 数据 库 , 量 化 不 同城 市 
中 乘客 与 司机 对 价格 的 敏感 度 、 候 车 时 间 等 相关 变量 ,并 随 变 量 的 改变 即时 


调整 算法 ,以 适应 不 断 变动 的 市 场 情 况 。 


另外 ,Uber 的 动态 定价 严格 意义 上 来 说 应 该 是 “基于 需求 的 动态 定价 ”， 
因为 在 同一 时 间 里 ,并 不 是 所 有 产品 都 面临 “上 下 班 高 峰 ? 或 者 "暴风雨 ”的 外 
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部 条 件 ,而 所 谓 “ 传 统 的 基于 时 间 动 态 定价 ”的 产品 ,例如 迪士尼 乐园 门票 , 同 
样 是 销量 导向 的 产品 ,同一 时 间 所 有 产品 都 面临 同样 外 部 条 件 。Uber 的 “ 共 
享 经 济 ” 模 式 与 传统 的 商业 模式 有 本 质 的 区 别 。 

2014 年 12 月 ,澳大利亚 悉尼 的 公共 场所 发 生 了 一 次 匪徒 持 枪 劫持 事 
件 。 路 人 都 四 散 奔 逃 , 没 车 的 人 只 能 叫 Uber 服务 。 由 于 需求 陡 增 , Uber 动 
态 定价 机 制 自动 决定 提 价 。 当 地 的 Uber 价格 瞬间 涨 到 原 有 价格 的 四 倍 。 
事件 过 后 ,澳大利亚 的 社会 评论 家 撰文 反击 Uber 跟 恐 怖 分 子 一 起 干 起 了 
“趁火打劫 ”的 买卖 。 各 大 社交 网 站 也 是 一 边 倒 地 怒斥 Uber 的 “无 良 举动 ”， 
在 重 压 之 下 ,Uber 同意 提供 最 多 200 澳元 的 退 款 。 虽 然 做 出 了 退 款 举动 ,但 
Uber 发 言 人 还 是 对 涨 价 之 举 做 出 了 解释 : 打车 服务 的 车 费 是 根据 算法 计算 
得 出 的 ,该 算法 会 对 需求 自动 做 出 回应 。 

实际 上 ,Uber 可 以 看 作 一 个 双边 共享 平台 ,让 想 坐 车 的 乘客 在 合适 的 时 
机 打 到 车 ;也 可 以 看 作 是 双向 资源 匹配 问题 ,价格 则 是 解决 匹配 问题 的 杠杆 ， 
基于 差异 化 的 时 间 和 需求 ,动态 调整 行程 和 价格 ,可 以 有 效 调 度 双边 资源 , 当 
实时 数据 积累 到 一 定 程度 ,再 利用 大 数据 技术 更 精准 地 预测 路 况 ,从 而 智能 
调整 价格 。 在 出 行 这 样 一 个 长 期 以 来 定价 几乎 完全 受 人 为 控制 的 行业 ， 
Uber 通过 动态 定价 ,让 市 场 复位 ,重新 发 挥 “无 形 之 手 ” 的 力量 ,这 是 它 最 有 
价值 的 地 方 。 有 人 曾经 发 表 长 篇 文章 力 挺 Uber 应 该 获得 诺 贝尔 经 济 学 奖 ， 
认为 Uber 有 史 以 来 第 一 次 解决 了 人 类 经 济 学 上 最 大 难题 之 一 , 即 定价 问 
题 。 这 个 说 法 也 许 有 点 偏激 ,但 是 动态 定价 如 此 深入 人 心 并 让 人 又 爱 又 恨 的 
确 是 Uber 的 功劳 。 


Airbnb 的 动态 定价 算法 


Airbnb 作为 世界 上 最 大 的 居住 信息 共享 服务 型 平台 ,有 大 量 的 外 出 旅 
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游人 士 和 家 有 空房 出 租 的 房 主 ,不 同 于 电 商 平台 , 它 只 是 告诉 用 户 哪些 商品 
已 售 出 或 评价 如 何 , 而 无 须 关 心 买 家 卖家 在 哪里 。Airbnb 中 数 百 万 房 源 都 
是 独一无二 的 ,它们 有 自己 的 地 址 ,大 小 和 装饰 ,而 顾客 在 接待 ,饮食 或 旅游 
引导 方面 的 要 求 也 不 尽 相同 ,再 加 上 天 气 的 季节 性 变化 等 ,都 会 让 定价 问题 
变 得 更 加 复杂 。 


静态 的 定价 机 制 


Airbnb 的 产品 主管 Dan Hill 曾 设 计 了 这 样 一 套 定价 机 制 : 当 一 个 新 房 
主 开 始 在 网 站 上 添加 一 个 房 源 的 时 候 ,系统 提取 房 源 的 关键 属性 ,查看 在 这 
区 域 中 有 相同 或 相似 属性 的 且 被 成 功 预 订 的 房 源 ,同时 考虑 到 需求 要 素 和 季 
节 性 特征 ,提供 一 个 居中 的 价格 提示 。Airbnb 选择 了 三 大 类 型 的 数据 来 设 
置 价格 : 相似 性 、 新 旧 程 度 和 位 置 。 图 4. 8 给 出 了 一 个 例子 ,说 明 季 节 性 需 
求 和 当地 的 活动 会 导致 房屋 出 租价 格 起 伏 ,在 美国 得 克 萨 斯 州 奥斯汀 市 ,在 
South by Southwest Conference & Festivals® 和 Austin City Limits 
Festivals 音乐 节 期 间 , 房 屋 出 租价 格 会 上 涨 。 在 定价 算法 的 早期 版 本 中 , 算 
法 以 房 源 为 中 心 绘制 一 个 不 断 扩大 的 圆圈 ,考虑 在 房 源 位 置 附 近 不 同 半径 上 
与 其 特征 相似 的 房 源 。 

随 着 时 间 的 推进 ,Dan 也 在 不 断 改进 他 们 的 算法 ,目前 已 经 能 够 考虑 数 
干 种 不 同 的 因素 ,并 在 非常 精细 的 水 平 上 区 分 地 理 位 置 。 但 该 机 制 仍 然 存在 
两 个 不 足 。 其 一 , 它 给 出 的 这 些 价 格 提示 是 静态 的 ,事实 上 ,在 了 解 了 当地 的 
一 些 活动 和 旅游 的 季节 性 变化 之 后 , 它 应 该 在 一 年 的 不 同 季节 中 为 相同 属性 


@ ”South by Southwest Conference & Festivals: 西南 偏 南大 会 与 艺术 节 , 简 称 为 SXSW， 
是 每 年 在 美国 德 克 萨 斯 州 首府 奥斯汀 举行 的 一 系列 电影 ,交互 式 多 媒体 和 音乐 的 艺术 节 与 大 
会 ,目前 已 经 成 为 世界 上 最 大 规模 的 “音乐 十 电影 十 科技 ”盛会 。 
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Price SXSW 


Austin City Limits 
Music Festival 


1/14 4114 714 10/14 115 4/15 715 


图 48 房价 的 季节 性 变动 


的 房 源 建议 不 同 的 价格 。 但 它 并 没有 这 样 做 ,作为 对 比 ,航空 公司 则 会 在 日 
期 临近 时 改变 机 票 价格 ,订单 减少 时 将 价格 下 调 ,在 市 场 升温 时 将 价格 提高 。 
另外 一 个 不 足 是 ,工具 本 身 是 静态 的 。 事 实 上 , 当 工具 能 够 挖掘 到 前 所 未 有 
的 历史 数据 时 , 它 的 价格 提示 有 所 改善 ,但 算法 本 身 并 没有 变 得 更 好 。 


机 器 学 习 的 动态 定价 


在 动态 定价 方面 ,我 们 的 目标 是 希望 能 够 为 每 个 房 主 ,针对 他 们 的 房子 
计划 出 租 的 日 期 ,每 天 给 出 一 个 新 的 定价 提示 。 前 面 说 过 ,航空 公司 动态 调 
整 机 票 价格 已 经 几 十 年 了 ,而 且 常 常 是 实时 的 ,以 试图 确保 最 大 的 满座 率 , 以 
及 每 个 座位 卖 出 最 高 的 价格 。 酒 店 业 也 是 这 样 , 随 着 连锁 的 规模 变 得 越 来 越 
大 ,酒店 的 业务 数据 量 不 断 增 长 ,酒店 营销 也 被 搬 到 网 上 ,使 得 连锁 酒店 每 天 
可 以 多 次 变动 价格 。 因 此 ,Dan 的 团队 开始 对 动态 定价 加 大 开发 力度 , 随 着 
历史 数据 的 不 断 积 累 ,充分 挖掘 它们 的 意义 越 来 越 大 。 让 算法 自身 不 断 改 进 
非常 困难 ,尤其 是 希望 系统 给 出 的 价格 提示 具有 说 得 通 的 理由 。 在 某 些 情况 
下 ,Dan 希望 算法 能 够 有 自己 的 “思维 过 程 ”能 够 从 数据 中 学 习 而 不 断 提高 
水 平 。 机 器 学 习 几 乎 是 这 类 系统 的 必然 选择 。Dan 选择 了 一 个 分 类 机 器 学 
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习 模 型 ,使 用 房 源 的 所 有 属性 以 及 当前 市 场 的 需求 ,然后 预测 其 是 否 会 被 预 
定 。 系 统计 算 价 格 提示 基于 成 百 上 干 的 属性 ,如 是 否 包 含 早 餐 、 房 间 是 否 有 
一 个 私人 浴室 等 。 通 过 将 价格 提示 与 结果 进行 比较 ,对 系统 进行 训练 。 考 虑 
房 源 是 否 以 一 个 特定 的 价格 被 预订 ,将 帮助 系统 调整 其 价格 提示 以 及 评估 一 
个 价格 被 接受 的 概率 。 当 然 , 房 主 可 以 选择 比价 格 提示 更 高 或 者 更 低 的 价 
格 ,然后 系统 也 会 对 估计 概率 做 相应 的 调整 。 系 统 之 后 会 跟踪 房 源 在 市 场 上 
是 否 被 成 功 预订 ,并 使 用 这 些 信息 对 未 来 的 价格 进行 调整 。 

接 下 来 机 器 学 习 就 开始 发 挥 作用 了 。 通 过 分 析 哪 些 价格 提示 获得 了 成 
功 ,Airbnb 系统 开始 调整 不 同房 源 属性 的 权重 。 一 开始 会 做 一 些 假设 ,例如 
地 理 位 置 非 常 重要 ,而 是 否 有 热 水 浴缸 就 没有 那么 重要 。 他 们 保留 了 以 前 的 
定价 系统 中 所 考虑 的 某 些 房 源 属性 ,同时 又 添加 了 一 些 新 的 属性 ,如 “预订 日 
期 之 前 的 剩余 天 数 ”, 这 些 信 息 都 会 对 动态 定价 产生 影响 。 所 有 新 的 信息 被 
考虑 到 模型 中 ,都 是 通过 对 历史 数据 的 分 析 , 表 明 它 们 与 动态 定价 有 相关 性 。 
例如 , 某 些 照片 更 可 能 吸引 预订 。 总 的 趋势 可 能 会 让 你 大 吃 一 惊 ,时 尚 、 明 亮 
的 客厅 的 照片 ,虽然 易于 得 到 专业 摄影 师 的 偏爱 ,但 相 比 于 用 暧 色调 装饰 的 、 
舒适 的 卧室 的 照片 ,它们 并 没 能 吸引 更 多 的 潜在 客人 。 随 着 时 间 的 推移 , 系 
统 能 够 为 每 个 定价 提示 产生 一 个 各 种 因素 及 相应 权重 的 列表 。 

Dan 的 系统 也 在 不 断 地 调整 地 图 以 反映 街区 边界 的 变化 。 因 此 ,系统 
并 不 是 依赖 于 当地 的 地 图 ,例如 ,一 个 当地 的 地 图 可 能 告诉 我 们 波 特 兰 开 
拓 者 队 的 恩 光 街区 在 哪个 地 方 结束 ,里 士 满 街 区 从 哪个 地 方 开始 ,但 这 并 
不 是 预订 者 所 关心 的 ,Dan 依靠 一 个 城市 中 房 源 的 预订 和 价格 的 分 布 数据 
来 描绘 各 种 曲线 。 这 种 做 法 也 让 他 们 发 现 了 以 前 所 没有 意识 到 的 “ 微 街 
区 ”。 这 些 地 区 可 能 有 大 量 的 流行 的 房 源 ,但 它们 并 不 一 定 与 标准 的 街区 
边界 相 匹 配 , 或 者 可 能 存在 一 些 局 部 特征 ,根据 这 个 特征 ,将 一 个 较 大 的 传 
统 街区 分 为 一 个 个 小 的 部 分 可 能 更 加 理想 。 图 4. 9 就 是 根据 这 样 的 方法 
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绘制 出 的 伦敦 “ 微 街 区 ”。 


图 49 伦敦 的 微 街区 "分布 


今天 ,这 些 工具 为 来 自 于 全 球 的 Airbnb 房 源 提供 价格 提示 。 但 是 这 些 
工具 除了 帮助 潜在 的 房 主 为 在 线 出 租 服务 更 好 地 设置 合理 的 价格 之 外 ,事实 
上 还 可 以 做 得 更 多 。 所 以 ,Dan 的 团队 将 这 些 工具 所 基于 的 机 器 学 习 平 台 
(Aerosolve) 作 为 一 个 开源 工具 发 布 。 它 将 为 那些 还 没有 接触 过 机 器 学 习 的 
从 业 人 员 提 供 一 个 很 好 的 范例 。 


电 商 动态 定价 掀起 价格 战 


动态 定价 一 度 作 为 收益 管理 的 同义词 ,不 仅 在 航空 领域 .出 行 领域 长 期 
推行 并 取得 巨大 效益 ,在 电子 商务 领域 也 早已 大 量 普及 。 

华尔街 日 报 的 最 近 报 告 表明 电子 零售 商 的 定价 策略 : 根据 价格 研究 公 
司 Decide Ine 的 数据 ,一 个 通用 电器 变频 微波 炉 在 一 天 内 价格 会 变动 9 次。 
在 Amazon 网 站 上 ,价格 在 744. 46 一 871. 49 美元 浮动 ;而 百思买 的 价格 在 
809. 99 一 899. 99 美元 浮动 , Amazon 价格 上 涨 的 时 候 百思买 会 跟着 上 涨 ; 
Amazon 价格 降低 时 ,百思买 也 跟着 降低 。 这 些 例子 就 是 动态 定价 , 且 已 经 
被 频繁 用 到 Pricegrabber、Nextag 这 样 的 新 型 网 站 以 及 元 老 级 的 eBay 和 
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的 只 有 一 个 : 与 竞争 对 手 更 好 地 竞争 ,通过 差价 促进 销售 。 
黑色 星期 五 ?是 美国 一 年 一 度 的 购物 狂欢 日 ,为 了 在 低 价 的 


次 件 系统 监控 对 手 并 且 每 日 多 次 调整 价格 已 经 成 为 必 不 


用 彻夜 


4. 10 所 示 。 在 消费 者 踏破 卖场 的 门槛 , 争 抢 打折 商品 的 时 
也 商 却 在 绞 尽 脑汁 展开 价格 战 。 对 于 顾客 来 说 ,网 上 比价 


E 队 。 所 以 零售 商 必须 第 一 时 间 提 供 最 低 的 价格 。 随 着 电 
昌 起 和 各 种 数据 财 季 分 析 工 具 的 诞生 ,零售 商 对 竞争 对 手 的 反应 前 
决 和 精确 ,在 竞争 对 手 出 价 后 数秒 就 马上 跟 进 。 传 统 零售 商 被 迫 转 


型 ,跟随 电 商 的 弹性 定价 。 价 格 战 不 再 只 是 拼 低 价 ,而 是 成 为 信息 挖掘 和 策 


略 的 系统 


七 拼 。 


en 四 回 


Black Friday Week 


图 410 黑色 星期 五 " 电 商 促销 


排名 机 制 对 价格 战 的 推动 


价格 调整 最 频繁 的 是 在 亚马逊 上 销售 产品 的 网 店 。 亚 马 逊 鼓励 零售 商 
之 间 展 开 无 情 的 竞争 ,争夺 搜索 结果 的 榜首 位 置 。 例 如 儿童 服装 店 Cookie's， 
为 了 保住 在 亚马逊 排名 中 的 领先 位 置 ,卖家 使 用 了 软件 ,每 15 分 钟 修改 一 
次 价格 。 店 主 法 拉克 说 ,他 在 亚马逊 上 销售 的 服装 经 常 比 他 在 纽约 布鲁克 林 
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的 商店 卖 得 便宜 。“ 对 于 新 到 货 的 当 季 新 颖 款式 ,我 们 还 没 来 得 及 好 好 营销 ， 
就 已 经 在 以 低 于 自己 预期 的 价格 销售 了 。? 对 于 那些 在 亚马逊 上 销售 产品 的 
而 


售 商 来 说 ,拥有 最 低 的 售 价 是 跻身 令 人 垂 省 的 “购物 推荐 榜 ” 的 最 快捷 径 。 
购物 推荐 榜 或 默认 商品 榜 上 的 产品 会 有 95%% 的 机 会 被 买 家 选中 。 


算法 软件 加 快 价格 迭代 速度 


提供 价格 调整 软件 的 Mercent 公司 称 ,它们 的 软件 一 小 时 内 可 以 修改 
200 万 件 商品 的 价格 。 该 软件 会 根据 各 种 不 同 因素 来 定价 ,例如 竞争 对 手 的 
价格 .竞争 对 手 的 运输 价格 以 及 季节 销售 额 等 。 零 售 商 自 行 设置 价格 调整 的 
时 间 频 率 、 要 跟踪 的 产品 和 可 以 忽视 的 竞争 网 站 。 价 格 变化 最 频繁 的 是 家 上 
电子 产品 ,服装 、 鞋 子 、. 珠 宝 和 洗涤 剂 , 剃 须 刀片 之 类 的 居家 必需 品 。Mercent 
公司 CEO 埃 里 克 … 贝斯 特 (Eric Best) 说 :“ 从 长 期 来 看 ,这 意味 着 价格 不 再 
是 单纯 的 价格 。” 

网 店 Cookie”s 的 店主 法 拉克 说 ,频繁 修改 价格 大 大 促进 了 销量 ,但 是 也 
需要 注意 价格 底线 。 他 首先 在 软件 里 设 定 了 与 竞争 对 手 的 价格 优势 比例 , 接 
着 他 设 定 了 一 个 不 能 逾越 的 价格 底线 ,然后 他 将 竞争 对 手 限定 为 那些 在 亚 马 
逊 五 星 评级 系统 里 至 少 获得 两 星 以 上 评级 的 商家 。 

根据 电 商 比价 网 站 Decide. com 提供 的 数据 ,迄今 为 止 , 买 家 在 价格 游戏 
中 输赢 参半 : 大 约 一 半 的 价格 修改 是 降价 ,一 半 是 提 价 。Decide. com 对 商品 
价格 进行 全 时 追踪 ,从 而 确定 最 佳 的 购物 时 机 。 价 格 变化 有 可 能 非常 剧烈 。 
据 Decide. com 网 站 透露 ,2017 年 6 月 ,亚马逊 上 的 零售 商 在 一 天 之 内 对 一 款 
三 星 43 寸 等 离子 电视 的 价格 进行 了 4 次 修改 ,价格 变动 区 间 为 398 一 424 美 
元 。 中 午时 分 ,百思买 将 这 款 电 视 的 售 价 从 400 美元 提 至 500 美元 ,之 后 又 
调 了 价格 ,而 在 线 电 子 产 品 零售 商 新 蛋 公 司 (Newegg) 早 间 将 该 款 电视 的 
价格 从 500 美元 提高 到 600 美元 。 亚 马 逊 .百思买 和 新 蛋 都 拒绝 对 此 予以 
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置 评 。 


收益 管理 夫 动 态 定 价 


收益 管理 是 对 有 限 资 源 和 服务 充分 利用 的 一 种 商业 模式 ,其 目标 是 最 大 
化 企业 获 利 。 由 于 一 定时 段 内 的 供给 是 特定 的 ,如 果 你 让 它 空闲 ,对 于 企业 
来 说 就 意味 着 损失 ,因为 企业 的 固定 营业 成 本 并 不 会 因此 减少 或 消失 。 

然而 ,最 大 化 收益 是 动态 定价 的 目标 吗 ? 对 此 ,亚马逊 曾 做 过 一 次 差别 
定价 实验 。2000 年 9 月 ,亚马逊 选择 了 68 种 DVD 碟 片 进行 动态 定价 试验 ， 
根据 潜在 客户 的 人 口 统计 资料 、 在 亚马逊 的 购物 历史 、 上 网 行为 以 及 上 网 使 
的 软件 系统 确定 对 这 68 种 碟 片 的 报价 水 平 。 例 如 ,名 为 《 泰 特 斯 XTitus) 
的 碟 片 对 新 顾客 的 报价 为 22. 74 美元 ,而 对 那些 对 该 碟 片 表现 出 兴趣 的 老 顾 
客 的 报价 则 为 26. 24 美元 。 通 过 这 一 定价 策略 ,部 分 顾客 付出 了 比 其 他 顾客 
更 高 的 价格 ,亚马逊 因此 提高 了 销售 的 毛利 率 。 但 是 好 景 不 长 ,差别 定价 策 
略 实施 不 到 一 个 月 ,成 百 上 干 的 DVD 消费 者 通过 互联 网 知道 了 此 事 , 导 致 那 
些 付出 高 价 的 顾客 怨声载道 。 除 此 之 外 ,这 次 事件 曝光 后 ,消费 者 和 媒体 开 
始 怀疑 亚马逊 是 否 利用 其 收集 的 消费 者 资料 作为 其 价格 调整 的 依据 ,引起 了 
公众 对 隐私 保护 的 担忧 。 为 挽回 日 益 凸 显 的 不 利 影响 ,亚马逊 的 首席 执行 官 
贝 佐 斯 亲自 出 马 , 进 行 危机 公关 ,答应 给 所 有 在 价格 测试 期 间 购买 这 68 部 
DVD 的 消费 者 以 最 大 的 折扣 。 至 此 ,亚马逊 的 “身份 定价 ”试验 以 完全 失败 
而 告终 ,亚马逊 不 仅 在 经 济 上 蒙受 了 损失 ,而 且 声 誉 也 遭受 了 影响 。 

因此 ,在 动态 定价 的 设计 上 ,不 能 纯粹 以 收益 最 大 化 为 目标 ,而 是 要 以 尽 
量 更 多 地 考虑 供需 双方 的 满意 度 ,让 双方 都 认为 公平 和 值得 信赖 。 否 则 ,一 
个 买 廉价 用 品 的 客户 会 以 低 价 得 到 一 个 产品 ,而 经 常 买 高 价 物品 的 顾客 却 要 
为 此 产品 支付 更 高 的 价格 ,这 虽然 对 供 方 有 利 ,但 会 令 需求 方 蒙受 损失 ,这 样 
做 的 结果 就 是 平台 的 失信 ,从 而 最 终 令 每 一 方 都 无 利 可 图 。 
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动态 定价 缓解 旅客 运输 压力 


在 日 本 ,为 了 方便 游客 在 东京 和 大 阪 之 间 的 交通 ,铁路 部 门 推出 了 一 款 
“7 日 票 ”, 即 7 日 日 本 全 国 JRPASS 周游 券 ,折合 人 民 币 1600 元 左右 ,可 以 
不 限 次 在 两 个 城市 之 间 往 返 乘坐 。 图 4. 11 给 出 了 旅游 部 门 的 推荐 线路 ,从 
东京 到 大 孤 7 天 的 行程 ,如 果 不 使 用 JRPASS 的 话 ,需要 花费 交通 费 总 计 
1720 元 左右 ,如 果 想 去 别 的 地 方 价格 会 更 高 。 但 如 果 使 用 JRPASS 全 国 券 ， 
仅 需 1600 元 就 可 以 走 遍 7 天 行程 的 每 个 地 方 ,同时 还 可 以 省 去 每 次 买 票 排 
队 的 时 间 , 以 及 恼人 的 语言 障碍 , 何 乐 而 不 为 呢 ? 这 似乎 感觉 一 切 都 很 划算 。 
但 实际 上 大 部 分 人 都 无 法 把 行程 排 得 这 么 满 ,而 常常 会 在 迪士尼 乐园 玩 上 两 
天 ,或 者 到 东京 购物 三 天 ,导致 实际 上 坐车 的 开销 还 不 到 票 价 的 一 半 , 这 样 
JRPASS 就 不 合适 了 ,还 不 如 每 次 都 单独 买 票 。 其 实 这 样 的 定价 措施 早已 成 
为 一 种 成 熟 的 商业 模式 ,铁路 公司 通过 复杂 的 差别 定价 ,一 方面 吸引 需求 各 
异 的 客户 以 增加 收益 ,一 方面 间接 促进 当地 旅游 经 济 的 发 展 ,一 举 两 得 。 


本 成 田 机 场 -新 宿 ”乘坐 成 田 特快 NEX 3200 站 < 半 200 元 | 
新 宿 -东京 周边 ”乘坐 JR 山手 线 前 往 新 宿 ”900 门 吃 ¥56 元 


上 野 /池袋 /银座 地 区 

乘坐 JR 中 央 线 通勤 快速 ”往返 价格 
富士 山 一 日 游 ”河口 湖 行 两 个 半 小 时 4700 门 =Y300 元 

即 可 到 达 富 士 山 


乘坐 JR 埔 京 线 到 新 木 场 “往返 价格 
(@3) 东 训 前 三 + 尼 要 类 JR 娄 弃 线 到 各 1400 门 =Y87 元 


从 未 京 前 往 大 阪 ， 委 从 新 干线 HIKARI 号 -单程 票 从 


或 者 KODAMA 号 14000 四 ~ ¥868; 
R 波 附 往返 价格 
到 达 大 阪 后 可 前 往 难 波 附近 480 门 =y30 元 


65) 可 前 往 京都 、 奈 良 观光 游览 ， 大 阪 -京都 。 ”往返 价格 ¥70 元 
大 阪 - 奈良 往返 价格 100 元 


前 往返 价格 
可 前 往 环球 影 城 ， 体 验 哈 利 演 特 与 好 莱 坞 。 篇 中 9 洁 y23 元 


从 大 卫衣 往 关 西 机 场 科 从 关 匀 特快 HARUKA 号 1200 门 =Y 75 元 


图 411 日 本 7 日 火车 票 路 段 
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这 个 差别 定价 原则 可 以 借鉴 , 却 不 可 以 照搬 照抄 。 我 国 的 国情 是 ,铁路 的 
客户 不 是 太 少 ,而 是 太 多 了 ,特别 是 在 春运 期 间 。 所 以 我 们 运用 弹性 的 差异 化 
定价 原则 ,希望 它 达 到 的 效果 不 是 吸引 更 多 的 人 ,而 是 分 散 原 来 高 度 集聚 的 需 
求 。 例 如 ,在 春运 期 间 , 买 票 难 也 不 是 在 各 个 线路 各 个 方向 同时 成 比例 地 难 。 
一 般 来 讲 ,上 海 到 四 川 的 车 票 难 买 ,但 是 四 川 到 上 海 的 车 票 就 相对 容易 。 如 果 
春运 是 因为 大 量 离 乡 务工 人 员 想 回 家 造成 的 ,而 从 沿海 到 内 地 的 火车 必须 再 
开 回 沿海 的 话 ,那么 几乎 可 确定 : 在 上 海通 往 四 川 和 贵州 的 车 票 "一 票 难 求 ” 的 
时 候 , 从 四 川 和 贵州 开 往 上 海 的 火车 是 “一 客 难 求 ”。 这 说 明 现在 的 价格 没有 弹 
性 ,没有 差异 化 ,结果 大 量 的 运 量 没有 释放 出 来 ,很 多 火车 是 在 空 跑 。 

如 果 能 差异 化 定价 ,在 提高 从 沿海 往 内 地 的 车 票 价格 的 同时 ,大 幅 减少 
从 内 地 向 沿海 的 车 票 价格 ,会 吸引 部 分 民工 不 回 家 ,把 家 里 人 接 出 来 过 年 。 
这 样 一 来 ,就 可 以 部 分 缓解 原来 的 “一 票 难 求 "。 图 4. 12 是 大 家 熟悉 的 春运 
期 间 买 票 难 的 场景 。 


图 412 春运 期 间 买 票 难 


很 多 人 说 ,这 是 不 可 能 的 ,因为 回老家 过 年 是 中 国人 的 传统 。 但 传统 从 
来 就 不 是 一 成 不 变 的 。 过 去 上 海 人 过 年 也 回 家 ,为 什么 现在 很 多 上 海 人 过 年 
过 到 海南 ,甚至 去 东南 亚 了 呢 ? 再 次 ,我 们 不 是 不 承认 这 个 传统 的 力量 。 弹 
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性 定价 ,恰恰 就 是 尊重 了 回 家 过 年 的 传统 ,所 以 对 于 牺牲 了 回 家 过 年 的 人 ,我 
们 给 予 了 奖励 : 你 可 以 以 很 低 的 成 本 到 上 海 和 北京 来 看 看 。 

我 们 还 可 以 提前 一 年 或 者 半年 售卖 春运 车 票 ,这 有 利于 大 家 提前 安排 时 
间 , 也 有 利于 铁路 部 门 根据 出 售 车 票 的 情况 安排 运力 。 因 为 可 以 提前 购 票 ， 
也 加 大 了 黄牛 的 资金 压力 和 风险 ,不 利于 黄牛 的 生存 。 提 前 购 票 还 可 以 使 得 
弹性 票 价 成 为 可 能 。 火 车 票 可 以 向 飞机 票 学 习 , 在 不 同时 间 段 给 出 不 同 的 折 
扣 。 例 如 提前 一 年 或 半年 购 票 的 加 价 100% ,然后 每 个 月 下 降 10%。 这 样 对 
价格 不 太 敏 感 而 回 家 需求 强烈 的 人 可 以 早 一 点 按照 高 价 购买 到 车 票 , 而 对 车 
票 价 格 敏感 的 人 可 以 等 待 并 承担 买 不 到 的 风险 。 这 与 目前 廉价 航空 的 越 早 
订 票 越 便宜 恰恰 相反 ,但 原则 是 一 样 的 ,只 是 目的 不 同 。 廉 价 航 空 希望 吸引 
客户 ,而 铁路 系统 希望 减少 春运 的 需求 。 

最 后 ,不 能 不 面 对 的 是 一 个 补贴 弱者 的 问题 。 上 述 经 济 手段 调节 需求 的 
结果 ,简单 言 之 ,就 是 把 票 给 了 出 价 最 高 的 人 。 如 果 一 定 要 在 春节 的 特殊 时 
期 ,给 收入 较 低 的 人 回 家 过 年 以 一 定 的 福利 ,政府 就 需要 给 予 财政 补贴 。 但 
是 ,这 种 对 待 特殊 群体 的 补贴 票 , 很 显然 也 应 该 实行 实名 制 。 事 实 上 ,现在 给 
学 生 的 折扣 票 就 是 一 种 实名 制 售 票 。 不 过 这 里 涉及 更 复杂 的 身份 认定 问题 ， 
已 经 超出 了 一 个 公司 的 能 力 范围 。 更 何况 ,中 国 的 火车 票 市 场 是 供 小 于 求 的 
问题 ,如果 铁路 总 公司 成 为 一 个 完全 市 场 化 运作 的 公司 ,这 个 问题 就 更 难 解 
决 。 有 时 候 , 再 强大 的 算法 也 不 得 不 面 对 现实 社会 的 难题 。 


未 来 的 动态 定价 一 一 服务 证 券 化 


不 同 于 传统 算法 ,现在 悄然 主导 我 们 生活 的 是 “能 够 学 习 的 机 器 ”, 它 们 
通过 学 习 我 们 琐碎 的 数据 来 执行 任务 ;甚至 我 们 还 没 提出 要 求 , 它 们 就 能 完 


148 


第 4 章 动态 定价 , 应 对 供需 剧烈 变化 的 赛 博 新 市 场 


成 我 们 想 做 的 事 。 


一 一 佩 德 。 多 明 匡 斯 《终极 算法 》 
在 商业 社会 高 度 发 达 , 服 务 的 供给 和 需求 都 在 高 频率 地 发 生 的 背景 下 ， 


我 们 不 得 不 面 对 以 下 三 个 问题 : 


(1) 如 何 快速 操 合 服务 提供 者 和 需求 者 ,并 给 出 公允 的 定价 促使 交易 


发 生 ? 


应 。 


(2) 当 服 务 价格 偏离 公允 价格 时 ,系统 如 何 修 正 不 合理 的 定价 ? 

(3) 当 服务 行为 发 生 在 未 来 时 ,如 何在 当下 进行 定价 和 交易 ? 

面 对 大 规模 ,高 速度 的 服务 请 求 , 现 有 的 动态 定价 模式 也 越 来 越 难以 响 
在 这 里 我 们 提出 一 种 将 服务 作为 一 种 有 价 证 券 , 并 投放 二 级 市 场 交易 


(类 似 股票 市 场 ) 的 算法 来 解决 这 些 问题 。 


公允 价格 的 发 现 一 一 集合 竞价 


例 。 


为 了 更 加 形象 地 阐释 服务 证 券 化 的 理念 ,我 们 以 顺风 车 服务 的 运营 为 
假设 小 明 是 一 个 深圳 的 私家 车 司机 ,他 第 二 天 要 去 广州 出 差 。 小 明 想 顺 


路 做 个 生意 , 载 客 从 深圳 前 往 广州 ,于 是 他 在 市 场 上 发 布 了 一 个 卖 单 ,希望 卖 


己 提供 的 载 客 服务 ,如 图 4. 13 所 示 。 


卖 出 服务 单 

司机 : 小 明 

出 发 地 : 深圳 

目的 地 : 广州 

时 间 : xxxx 年 xx 月 xx 日 
要 价 ; 600 元 


413 小 明 的 卖 出 服务 单 
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小 李 是 一 个 深圳 的 学 生 , 正 好 第 二 天 想 去 广州 游玩 ,于 是 他 也 在 市 场 上 
发 布 了 一 个 买单 ,希望 买 入 自己 需求 的 服务 ,如 图 4. 14 所 示 。 


买 入 服务 单 

乘客 : 小 李 

出 发 地 : 深圳 

目的 地 : 广州 

时 间 : xxxx 年 xx 月 xx 日 
出 价 ，300 元 


图 414 小 李 的 买 入 服务 单 


相似 地 ,市 场 上 有 干 干 万 万 的 司机 发 布 了 他 们 的 卖 出 服务 单 ,也 有 干 干 
万 万 的 潜在 乘客 发 布 了 他 们 的 买 入 服务 单 。 市 场 运用 大 数据 ,人 工 智能 等 技 
术 , 对 海量 的 买 入 单 、 卖 出 单 的 信息 进行 整合 .匹配 和 处 理 。 当 卖 出 单 提供 的 
服务 和 买 入 单 需求 的 服务 相 匹配 时 ,系统 进行 集合 竞价 ,直到 买卖 价格 一 致 ， 
交易 达成 。 这 个 达成 的 交易 ,被 像 是 一 张 证 券 ,作为 乘客 在 指定 时 间 和 地 点 ， 
接受 司机 提供 指定 服务 的 凭证 。 

这 种 公开 .透明 海量 的 交易 ,展现 了 一 种 发 现 公允 价格 的 模式 。 人 们 可 
以 通过 参考 交易 系统 公开 披露 的 成 交 信 息 , 对 特定 服务 的 价格 有 大 致 的 评 
估 。 在 网 约 车 的 应 用 场景 中 ,油价 的 上 涨 ` 道 路 的 维修 等 市 场 扰动 会 促使 司 
机 调整 服务 价格 ,乘客 也 会 跟随 卖 出 单 给 出 新 的 报价 。 在 这 种 买卖 双方 的 博 
弈 中 ,新 的 公允 价格 再 次 达成 。 


公允 价格 的 守护 一 一 套 取 利 差 


证 券 化 的 交易 系统 是 可 以 自我 修正 不 合理 的 价格 的 ,这 一 点 需要 依靠 市 
场 中 的 套利 交易 者 。 仍然 以 网 约 车 服务 为 例 ,这 里 我 们 不 考虑 时 间 因 素 
(图 4.15)。 
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假如 一 张 从 A 地 到 B 地 的 证 券 价格 为 300 元 ,从 B 地 到 C 地 的 证 券 价 
格 为 500 元 。 而 现在 ,一 张 A 地 到 C 地 的 证 券 价格 为 1000 元 。 

显然 , 当 A-B 的 证 券 和 B-C 的 证 券 被 公允 定价 时 ,A-C 的 证 券 定价 偏 高 
了 200 元 。 此 时 ,市 场 上 的 套利 者 发 现 机 会 ,花费 800 元 买 入 A-B 的 证 券 和 
B-C 的 证 券 ,然后 将 两 者 合成 为 A-C 的 证 券 ,再 以 1000 元 的 价格 卖 出 , 净 赚 


200 元 5 


300 元 500 元 


1000 元 


4 全 证 券 化 市 场 的 交易 闭环 


当 套 利 者 越 来 越 多 时 ,A-C 证 券 的 卖 单 越 来 越 多 ,价格 下 跌 ;A-B 证 券 和 
B-C 证 券 的 买单 越 来 越 多 ,价格 上 涨 。 这 两 个 过 程 共 同 压缩 套利 空间 ,驱使 
三 者 的 价格 公允 化 ,直到 套利 空间 消失 。 因 此 ,我 们 可 以 说 套利 是 市 场 动 态 
定价 过 程 中 ,公允 价格 的 守护 者 。 


跨 时 间 的 资源 整合 一 一 交易 未 来 


服务 证 券 化 的 另 一 个 优势 在 于 跨 时 间 的 资源 整合 。 仍 然 以 网 约 车 服务 
为 例 , 假 定 小 王 是 一 个 深圳 的 私家 车 司机 ,上 班 之 余 偶尔 为 市 场 提供 顺风 车 
服务 。 这 时 候 ,小 王 的 女 朋友 意 外 怀孕 ,突然 要 结婚 ,需要 一 大 笔 钱 。 此 时 ， 
小 王 可 以 提前 将 自己 未 来 3 个 月 内 提供 的 顺风 车 服务 打包 为 证 券 , 投 放 市 场 
降价 卖 出 , 短 时 间 内 获得 一 大 笔 钱 ,解决 燃眉之急 。 正 如 图 4. 16 所 示 , 在 这 
个 案例 中 ,小 王 通过 把 未 来 的 服务 证 券 化 ,实现 了 “向 未 来 的 自己 借 钱 ”的 
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一 月 二 月 三 月 四 月 


图 416 证 券 化 折 现 未 来 服务 


现在 我 们 从 服务 购买 者 的 角度 ,考虑 另 一 种 情形 。 在 深圳 工作 的 小 方 最 
近 想 去 广州 探望 父母 ,于 是 他 在 市 场 上 购买 了 小 王 出 售 的 证 券 ,预期 下 个 月 
坐 小 王 的 车 去 广州 。 结 果 就 在 出 发 的 前 一 天 ,小 方 的 老板 要 求 小 方 去 南非 出 
差 半 年 。 小 方 赶紧 把 自己 手头 的 证 券 重新 投放 市 场 ,降价 出 售 。 在 这 种 意外 
发 生 的 情形 下 ,乘客 小 方 通过 证 券 交 易 避 免 了 更 多 的 资金 损失 ,司机 小 王 也 
并 没有 因为 小 方 的 突 发 事务 失去 生意 ,是 一 个 双赢 的 结局 。 

无 论 是 司机 小 王 的 案例 ,还 是 乘客 小 方 的 案例 ,他 们 都 通过 降价 出 售 证 
券 来 满足 自己 各 自 的 需求 。 仔 细 思 考 可 以 发 现 , 这 里 “降价 的 部 分 ?是 出 价 者 
对 “快速 响应 要 求 ?的 定价 。 例 如 ,小 王 要 求 快速 拿 到 未 来 的 钱 ,以 降价 的 方 
式 加 快 出 售 ; 小 方 要 求 快 速 出 手 证 券 ,以 免 服 务 过 期 ,以 降价 来 吸引 市 场 
购买 。 
因此 我 们 可 以 发 现 ,服务 的 证 券 化 ,使 得 对 未 来 进行 交易 成 为 可 能 ,也 提 
高 了 服务 行为 的 效率 。 


算法 重新 定义 价格 


在 赛 博 新 经 济 时 代 , 互 联网 成 为 现代 社会 的 基础 设施 ,而 网 络 对 我 们 生 
活 最 深刻 的 影响 就 在 于 * 留 痕 ”, 留 下 的 痕迹 就 是 数据 。 数据 之 所 以 产生 价 


证 


152 


第 4 章 动态 定价 , 应 对 供需 剧烈 变化 的 赛 博 新 市 场 


值 ,不 在 于 “ 量 大 ”, 而 在 于 “ 线 上 ”, 因 为 数据 从 此 可 以 在 更 大 范围 内 流动 , 进 
而 产生 更 有 影响 力 的 价值 ,这 是 真正 的 数据 带 来 的 巨大 变化 。 阿 里 巴巴 技术 
委员 会 主席 王 坚 的 著作 (在 线 ) 中 也 提 到 ,当今 社会 ,“ 互 联网 ” 即 “ 基 础 设施 ”， 
“数据 ” 即 “ 生 产 资料 “计算” 即 “ 公 共 服 务 ”, 三 者 聚合 在 一 起 ,就 是 “计算 经 
济 ”。 计 算 经 济 中 很 重要 的 一 环 就 是 发 现 并 确定 数据 价值 。 数 据 的 价值 是 靠 
计算 发 现 的 , 云 计算 以 公共 服务 的 形式 让 每 个 人 都 能 获得 AlphaGo 所 需 的 
计算 能 力 ,计算 资源 容易 获取 ,不 再 被 垄断 。 正 因为 如 此 ,在 赛 博 新 经 济 时 
代 , 通 过 机 嚣 学习、 数据 挖掘 等 计算 方法 处 理 在 线 数据 ,用 更 高 效 的 手段 重新 
发 现 商品 价格 ,才能 更 理性 地 指导 人 们 在 赛 博时 代 下 的 经 济 生活 ,从 而 建立 
适应 时 代 变 化 的 市 场 新 秩序 。 

对 于 动态 价格 的 制定 规则 ,考虑 到 成 本 技术. 用户 接受 程度 .社会 影响 
等 诸多 要 素 , 目 前 ,大 部 分 的 应 用 场景 还 集中 在 航空 酒店 、 票 务 、 电 商 、 出 行 
等 领域 。 一 方面 ,由 于 这 些 必须 消费 品 时 刻 伴随 着 我 们 的 生活 ,从 本 地 服务 
到 外 出 旅行 ; 另 一 方面 ,用 户 在 与 这 类 产品 长 期 的 磨合 和 适应 过 程 中 ,已 经 养 
成 了 习惯 动态 定价 的 消费 观念 。 

事物 总 有 它 的 两 面 性 ,动态 定价 虽然 有 助 于 发 现 市 场 价格 , 却 也 带 来 了 
诸多 问题 ,例如 对 用 户 不 友好 、 影 响 客户 忠诚 度 , 以 及 企业 口碑 等 。 以 Uber 
为 例 , 可 能 更 多 用 户 不 会 理解 动态 定价 是 为 了 平衡 供需 ,而 是 会 觉得 Uber 
在 急用 车 时 翻 倍 涨 价 太 唯利是图 、 赚 黑心 钱 。 再 以 票务 为 例 , 如 果 在 采用 动 
态 定价 时 ,出 现 了 两 张 邻 座 票 价格 不 同 的 情况 , 买 高 价 票 的 就 会 觉得 自己 被 
欺骗 了 ,从 而 对 售票 方 表示 不 满 。 尤 其 是 高 铁 火 车 票 这 类 涉及 普通 群众 切身 
利益 的 商品 ,一 旦 通过 定价 调整 供需 有 失 偏颇 ,不 仅 关系 到 公平 性 ,更 会 对 社 
会 制度 产生 不 利 影响 。 

如 何 降低 这 种 影响 是 采用 动态 定价 的 企业 都 需要 认真 考虑 的 问题 。 如 
果 考 虑 的 因素 不 周全 ,那么 对 顾客 的 感知 价格 评估 就 不 准确 ,动态 定价 的 意 


| 
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义 对 于 传统 定价 的 优势 也 就 越 小 。 如 果 算 法 没 覆盖 到 ,一旦 遇 到 突 发 事件 ， 
反而 可 能 带 来 巨大 的 负面 影响 。 此 外 ,动态 定价 对 技术 要 求 比较 高 ,要 考虑 
投资 回报 率 。 对 于 某 些 企业 而 言 , 特 别 是 传统 企业 , 订 制 一 套 动 态 定价 系统 
的 成 本 并 不 低 , 相 比 它 可 以 带 来 的 潜在 收益 , 值 不 值得 投入 还 得 根据 企业 自 
身 的 需求 进行 评估 。 所 以 ,并 不 是 每 个 企业 都 有 能 力 采 用 动态 定价 。 

而 采取 创新 的 运营 策略 也 可 以 积极 降低 这 种 影响 ,同时 给 用 户 带 来 良好 
的 使 用 体验 。 例 如 滴 滴 的 “拼车 ”功能 ,就 是 根据 交易 撮合 的 程度 进行 动态 定 
价 。 当 乘客 计划 拼车 出 行 前 往 某 个 目的 地 ,他 在 下 单 时 会 选择 “目的 地 ”和 
“拼车 人 数 ”, 平 台 便 会 给 出 “一 口 价 ”, 该 价格 在 进入 行程 后 不 再 改变 。 例 如 ， 
从 北京 南 站 到 首都 国际 机 场 的 里 程 费 预计 100 元 ,平台 加 上 服务 佣金 预 估价 
160 元 , 当 有 4 人 选择 拼车 同行 ,平台 给 每 人 出 价 40 元 ,这 样 ,乘客 便 以 较 低 
的 价格 共享 了 该 行程 ,同时 司机 和 平台 都 赚 取 了 一 定 的 费用 。 但 是 这 样 双赢 
的 局 面 不 会 常常 出 现 , 为 了 提高 成 单 率 , 有 时 候 , 即 便 拼 不 满 4 个 人 ,系统 也 
会 分 配 司机 接 单 , 假 如 只 有 两 人 参与 以 上 行 
程 ,平台 就 需要 补贴 20 元 ,这 样 的 情况 多 了 ， 8 
滴 滴 难 免 亏损 严重 。 二 一 


3 


那么 ,如 果 根 据 交 易 气 合 的 程度 进行 动 

态 定价 , 当 拼车 人 数 不 足 以 祯 六 成 本 时 ,系统 |。 es 
给 出 “两 口 价 ”, 即 拼 单 成 功 一 个 价格 ,不 成 功 NN 
是 一 个 价格 ,用 户 可 以 权衡 时 间 和 价格 后 , 选 所 人 车 弹 1 
择 自 己 更 能 够 接受 的 行程 ,系统 也 不 至 于 亏 etl 
损 ,一 些 城市 正在 推广 实行 该 策略 。 如 图 4. Ml 
17 所 示 ,2017 年 5 月 26 日 , 滴 滴 在 北京 推出 人 
了 全 城 拼车 体验 活动 ,乘客 在 固定 站 点 上 车 ， © memes 


享受 “一 口 价 ” 服 务 。 图 4 人 7 滴 滴 守 口 价 ”拼车 活动 
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新 经 济 模式 对 传统 定价 方法 提出 的 挑战 越 来 越 多 ,趋向 高 频 交 易 特 征 的 
需求 变化 速度 日 益 加 快 ,对 于 某 种 服务 的 买卖 双方 ,供给 该 如 何 适应 需求 的 
高 速 而 剧烈 的 变化 ,在 不 能 适应 的 状态 下 ,又 该 如 何 找到 强 需 求 的 用 户 ,并 且 
精准 营销 进而 提供 专业 服务 ,或许 只 有 足够 智慧 的 算法 通过 重新 定义 价格 ， 
才能 更 好 地 将 这 些 问 题解 决 。 

随 着 每 个 细 分 领域 技术 的 不 断 和 迭代 ,以 及 对 用 户 需求 更 加 精准 的 把 握 ， 
基于 算法 的 动态 定价 将 以 更 细微 的 粒度 、 更 敏锐 的 时 间 、 更 合理 的 价格 变革 
传统 的 定价 方式 。 类 似 股 票 市 场 中 的 高 频 交 易 , 每 一 笔 价 格 会 在 反复 的 博弈 
过 程 中 逐渐 趋 于 理性 ,直到 达到 市 场 的 均衡 状态 ,在 最 后 一 飞 秒 内 成 交 。 那 
时 ,全 新 的 商业 模式 将 为 动态 定价 带 来 再 一 次 的 颠覆 性 革命 。 
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今天 的 人 们 早已 从 信息 匮乏 的 时 代 进 入 了 数据 大 爆炸 的 时 代 , 每 个 人 都 
是 信息 消费 者 ,也 是 信息 制造 者 。 然 而 ,我 们 却 越 来 越 难以 从 大 量 信息 中 找 
到 自己 感 兴趣 的 内 容 ,也 越 来 越 难 以 让 自己 生产 的 信息 脱颖而出 ,被 别人 看 
到 。 在 数据 的 汪洋 大 海中 ,并 不 是 每 一 杀 浪 花 都 具有 价值 ,可 我 们 却 常常 被 
那些 无 用 的 信息 庄 挟 , 深 陷 其 中 ,迷失 方向 。 数 据 本 身 并 不 产生 价值 ,按照 大 
数据 专家 的 观点 ,首先 需要 挖掘 数据 中 的 信息 ,然后 从 信息 中 建立 结构 并 发 
现 知识 ,再 把 知识 转换 成 能 力 , 基 于 能 力 建立 系统 ,系统 中 策略 的 执行 才 最 终 
产生 价值 。 这 个 链条 可 真 长 ! 我 们 可 以 简单 理解 为 只 有 有 序 的 数据 ,能 够 为 
户 提供 有 用 信息 的 数据 才能 产生 价值 。 那 么 到 底 如 何 才能 从 数据 中 找到 
价值 呢 ? 在 赛 博 的 世界 里 ,再 也 没有 谁 比 算法 更 有 能 力 给 数据 赋予 价值 了 。 
算法 是 如 何 做 到 这 一 点 的 呢 ? 


第 5 章 算法 , 让 数据 有 了 价值 


大 数据 的 发 展 带 来 了 人 类 新 文明 


计算 机 总 是 越 来 越 智能 的 。 科 学 家 告诉 我 们 不 久 它 们 就 能 跟 我 们 对 

话 了 (这 里 的 “它们 ”, 我 指 的 是 “计算 机 ”。 我 怀疑 科学 家 永远 都 不 能 跟 我 
们 对 话 )。 

一 一 达 沃 巴里 ,作家 


每 个 时 代 都 有 自己 的 “大 数据 ” 


如 果 我 们 回顾 历史 ,会 发 现 每 一 种 文明 的 更 蔡 都 伴随 着 信息 载体 的 变 
迁 ,而 信息 载体 的 变迁 ,又 带 来 了 信息 量 的 增长 。 无 论 在 哪个 时 代 , 都 存在 着 
对 于 那个 时 代 的 信息 载体 和 信息 处 理工 具 来 说 是 “规模 很 大 ”或 “很 复杂 ”的 
数据 集合 。 从 人 类 诞生 之 日 起 ,数据 就 不 断 产生 ,例如 部 落 的 人 口 .捕杀 的 猎 
物 . 农 田 的 收成 ,甚至 口 口 相传 的 传说 都 可 以 视 为 数据 。 数 据 逐 渐 产 生 、 积 
累 ,导致 数据 规模 越 来 越 大 ,数据 之 间 的 关系 也 越 来 越 复杂 。 当 数据 规模 和 
复杂 程度 逐渐 达到 甚至 超出 人 类 当时 的 数据 处 理 能 力 后 , 即 可 被 视 为 “大 数 
据 ” 一 一 尽管 当时 的 人 们 并 没有 “大 数据 ”的 概念 。 

在 文字 诞生 之 前 ,原始 先 民 生活 中 发 生 的 事件 只 能 靠 个 人 头脑 记忆 。 后 
来 发 生 的 事情 越 来 越 多 ( 即 “ 数 据 ” 规 模 越 来 越 大 ) ,只 靠 记忆 难免 发 生 混乱 。 
为 了 避免 忘记 以 往 的 事情 , 先 民 们 需要 花 上 一 整 天 的 时 间 来 复习 过 去 发 生 的 
事情 ,然而 翡 催 的 是 ,每 天 都 有 新 的 事件 发 生 。 这 无 疑 使 得 原本 困难 的 生活 
雪上 加 霜 , 记 忆 和 回忆 占用 了 大 量 时 间 , 都 没有 足够 的 时 间 进 行 渔猎 填 饱 肚 
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TF 

幸运 的 是 ,传说 中 神农 氏 发 明了 结 绳 记事 ,拯救 万 民 于 水 火 , 使 得 先 民 不 
必 每 天 花费 大 量 精力 记忆 众多 的 琐事 《周易 . 系 
辞 下 传 ? 中 说 :“ 上 十 结 绳 而 治 , 后 世 圣 人 易 之 以 书 
契 .? 其 意思 就 是 ,上 十 的 人 们 通过 在 绳子 上 打 结 
记事 ,后 世 的 圣人 发 明了 文字 ,开始 用 书写 和 文字 来 
代替 结 绳 记事 。 东 汉 经 学 家 郑玄 在 所 著 的 《周易 注 》 
中 解释 说 :“ 古 者 无 文字 , 结 绳 为 约 , 事 大 ,大 结 其 绳 ; 
事 小 ,小 结 其 绳 。 扩 周易 集 解 》 进 一 步 解释 说 :“ 古 本 
无 文字 ,其 有 约 拆 之 事 , 事 大 ,大 其 绳 , 事 小 ,小 其 绳 ， 
结 之 多 少 , 随 物 众 寡 ,各 执 以 相 考 , 亦 足以 相 治 也 。” 
图 5. 1 给 出 了 用 于 记事 的 绳 结 示意 图 。 

结 绳 记事 虽然 方法 简单 ,实际 上 也 包含 一 套 相 对 完备 的 “算法 ”, 即 大 事 
对 应 大 强 结 ,小 事 对 应 小 绳 结 ,数量 多 就 多 打 强 结 ,数量 少 就 少 打 绳 结 ,这 套 
简单 的 机 制 在 原始 社会 中 “足以 相 治 ”, 可 以 满足 一 般 的 生活 需求 。 结 绳 记事 
这 种 新 的 “数据 处 理 ” 方 式 , 配 合 语言 交流 ,使 人 们 可 以 更 加 方便 地 记 住 更 多 
的 事情 ,应 对 了 那个 时 代 的 “大 数据 挑战。 与 此 类 似 的 还 有 农耕 文明 中 的 甲 
骨 文 和 封建 文明 的 造纸 术 。 

近年 来 , 随 着 互联 网 和 移动 通信 技术 的 发 展 , 全 球 数据 总 量 呈 爆炸 性 增 
长 ,增长 速度 也 逐年 加 快 。1984 年 诞生 于 美国 旧金山 的 思科 (Cisco) 公 司 ,是 
全 球 IT 企业 中 的 巨 无 霸 。 作 为 全 球 顶 级 的 网 络 解决 方案 提供 商 , 仅 2016 财 
年 第 四 季度 的 收入 就 达 126 亿美 元 。 思 科 公司 在 (思科 可 视 化 网 络 指数 : 全 
球 移动 数据 流量 预测 白皮书 (2015 一 2020)》 中 ,对 2015 年 全 球 的 移动 数据 流 
量 做 了 详细 的 统计 分 析 ,并 对 未 来 五 年 的 移动 数据 流量 的 增长 做 出 了 预测 ， 
如 图 5.2 所 示 。 与 2014 年 相 比 ,2015 年 全 球 移动 数据 流量 增长 了 74%。 男 


图 51 用 于 记事 的 强 结 
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外 一 个 令 人 震惊 的 数值 是 ,2015 年 全 球 移动 数据 流量 是 15 年 前 的 4 亿 倍 ， 
是 10 年 前 的 4000 倍 。 截 至 2015 年 底 , 全 球 每 个 月 产生 的 移动 数据 量 平 均 
为 3.7EB, 而 在 2014 年 底 时 ,这 个 数值 是 2. IEB。 据 思科 公司 预计 ,到 了 
2020 年 ,全球 月 均 移 动 数据 流量 将 增长 8 倍 , 达 到 30. 6EB。 这 个 数据 量 堪 
称 惊人 。 要 知道 ,1EB 数据 包含 1 152 921 504 606 846 976 个 字 节 ,存储 1EB 
的 数据 需要 1 048 576 块 1TB 的 硬盘 。 
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图 52 思科 公司 预测 015-200 年 间 全 球 移动 数据 流量 增长 情况 单位 : 田 ) 


全 球 著 名 的 科技 咨询 顾问 提供 商 国际 数据 公司 (International Data 
Corporation,IDC) ,服务 领域 主要 集中 在 信息 技术 和 电信 等 行业 。IDC 在 报 
告 THE DIGITAL UNIVERSE IN 2020: Big Data, Bigger Digital 
Shadows，and Biggest Growth in the Far East 中 指出 ,2020 年 的 全 球 数 据 
总 量 将 是 2005 年 的 300 倍 , 达 到 40 000EB; 并 且 从 2013 年 开始 ,全 球 数据 总 
量 将 2 年 左右 就 翻 一 番 。 根 据 专 家 的 预测 ,到 2020 年 ,每 位 互联 网 用 户 平均 
每 天 要 产生 1. 5GB 的 数据 流量 ,一 辆 无 人 驾驶 汽车 每 天 产生 的 数据 量 将 达 
到 4000GB, 一 架 飞 机 每 天 产生 的 数据 量 将 达到 40 000GB, 一座 智 慧 工厂 每 
天 产生 的 数据 量 更 是 超过 1 000 000GB。 

大 数据 ,实际 上 就 是 人 类 文明 的 产物 。 不 同 的 时 代 , 因 为 数据 处 理 能 力 
不 同 ,对 何 种 数据 集合 是 “大 数据 ?也 有 不 同 的 认识 。 过 去 的 大 数据 ,可 能 就 
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是 现在 的 “小 数据 ”; 现 在 的 大 数据 ,可 能 就 是 将 来 的 “小 数据 ”。 大 数据 永远 


是 一 个 相对 的 概念 。 


运转 不 停 的 世界 每 天 都 有 大 量 数据 产生 ,未 来 还 将 有 更 加 大 量 的 数据 产 


生 。 并 且 , 在 信息 技术 的 催 动 下 ,数据 洪流 以 前 所 未 有 的 速度 席卷 到 我 们 4 
活 中 的 每 个 角落 ,我 们 每 个 人 都 身 处 其 中 ,没有 人 能 够 例外 。 


赛 博时 代 的 大 数据 


这 


虽然 每 个 时 代 都 有 自己 的 大 数据 ,但 是 大 数据 真正 被 我 们 熟知 却 并 没有 
多 久 。 一 般 认 为 ,20 世纪 90 年 代 , 由 于 计算 机 科学 家 约翰 ' 马 西 (John 
Mashey) 的 大 力 推广 ,大 数据 一 词 才 慢 慢 流 行 起 来 。 我 们 能 从 图 5. 3 的 百度 


指数 清晰 地 看 出 2011 一 2016 年 以 "大 数据 ?为 关键 字 的 搜索 趋势 (上 面 曲线 


) 


和 媒体 关注 (下 面 曲线 ) 变 化 情况 。 图 5.4 是 谷歌 趋势 给 出 的 2004 一 2016 年 
以 “Big Data” 为 关键 字 的 搜索 热度 。 从 这 两 个 图 都 可 以 看 出 ,大 数据 一 词 大 


概 于 2012 年 才 慢 慢 进 入 公众 视野 ,并 成 为 一 个 越 来 越 热门 的 话题 。 


图 53 ”人 类 数据 "一 词 的 搜索 指数 和 媒体 指数 


根据 维基 百科 的 定义 ,大 数据 (Big Data) ,又 称 巨 量 数据 、 大 资料 , 指 的 
是 所 涉及 的 数据 量规 模 巨大 到 无 法 通过 入 工 或 计算 机 在 合理 的 时 间 内 达到 
截取 ,管理 ,处 理 并 整理 成 为 人 类 所 能 解读 的 形式 的 信息 。 百 度 百科 则 将 大 
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热度 随时 间 变 化 的 趋势 名 


54 ”ig Data" 一 词 的 搜索 热度 


数据 定义 为 : 无 法 在 一 定时 间 范 围 内 用 常规 软件 工具 进行 捕捉 、 管 理 和 处 理 
的 数据 集合 ,需要 新 处 理 模 式 才 能 具有 更 强 的 决策 力 、 洞 察 发 现 力 和 流程 优 
化 能 力 的 海量 、 高 增长 率 和 多 样 化 的 信息 资产 。 

这 听 起 来 也 许 有 些 抽象 。 如 果 不 使 用 这 些 严 谨 的 科学 术语 ,大 数据 到 底 
是 什么 呢 ? 大 数据 和 普通 的 数据 有 什么 区 别 呢 ? 其 实 ,通俗 地 说 ,如 果 数 据 
规模 不 断 增 长 或 者 复杂 程度 不 断 提 升 ,以 至 让 我 们 觉得 这 些 数 据 处 理 起 来 很 
棘手 时 ,普通 的 数据 就 一 跃 成 为 “大 数据 ”。 

大 数据 一 词 流行 之 前 ,人 们 通常 使 用 海量 数据 (Mass Data 或 Massive 
Data) 一 词 来 指 代 大 规模 的 数据 集合 。 但 是 ,我 们 不 应 简单 地 把 “大 数据 ? 当 
作 * 海 量 数据 ?的 同义词 。 事 实 上 , 赛 博时 代 的 大 数据 除了 数据 规模 大 之 外 ， 
通常 还 具有 流转 速度 快 `, 数 据 类 型 多 .价值 密度 低 等 特点 ,这 就 与 以 往 “ 海 量 
数据 ?有 了 本 质 区 别 。 


大 数据 蕴含 的 大 能 量 


人 类 活动 产生 了 大 量 的 数据 ,这 些 大 数据 中 存储 了 大 量 的 信息 ,大 数据 
对 人 类 的 价值 就 在 于 这 些 信息 的 价值 。 我 们 先 从 一 件 小 事 中 一 宕 大 数据 列 
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含 的 “能 量 ”。 

1986 年 ,美国 自动 化 领域 的 先驱 、 迪 堡 集团 有 限 公 司 (The Diebold 
Group，Inc. ) 的 创始 人 约翰 . 迪 堡 (John Diebold) 提 到 了 这 样 一 件 趣事 。 
1979 年 ,一 家 银行 在 某 地 区 安装 了 ATM 机 网 络 。 但 是 银行 发 现 , 某 一 台 取 
款 机 每 天 凌晨 0 点 到 2 点 之 间 都 会 发 生 大 量 的 提 款 操作 。 这 是 怎么 回 事 呢 ? 
银行 怀疑 这 里 发 生 了 违规 行为 ,于 是 专门 雇用 了 侦探 对 此 进行 调查 。 调 查 的 
结果 充满 戏剧 性 ,侦探 发 现 这 个 提 款 机 刚好 位 于 红灯区 附近 ,午夜 光顾 红 灯 
区 的 人 们 当然 不 想 刷卡 消费 ,因为 这 会 在 信用 卡 交易 中 产生 一 笔 “不 光彩 ”的 
记录 。 于 是 ,这 些 顾客 总 是 先 在 这 部 ATM 机 上 取出 现金 ,然后 去 红灯区 
消费 。 

如 果 通 过 一 台 提 款 机 的 取款 记录 能 算出 某 个 特定 区 域 的 消费 特征 ,那么 
如 果 把 全 国 所 有 提 款 机 的 取款 记录 都 做 采集 分 析 , 再 辅 以 特定 的 计算 机 算 
法 ,能 算出 的 就 不 仅 限于 红灯区 消费 了 ,甚至 可 以 更 详细 地 了 解 全 国人 口 的 
储蓄 能 力 、 消 费 水 平 、 消 费 习惯 .资金 往来 资产 负债 等 情况 。 

大 数据 还 可 以 让 搜索 引擎 在 公共 卫生 领域 发 挥 作用 。 谷 歌 公 司 曾 于 
2008 年 推出 了 流感 趋势 系统 (Google Flu Trends) 和 登革热 趋势 系统 
(Google Dengue Trends) ,这 套 系 统 采集 了 美国 人 平时 经 常 使 用 的 5000 万 
个 搜索 关键 字 和 2003 一 2008 年 间 美国 疾 控 中 心 公布 的 疾病 传播 数据 ,发 现 
了 特定 搜索 关键 字 和 疾病 传播 数据 之 间 具 有 相关 性 。 如 果菜 地 区 包含 特征 
字段 的 搜索 关键 字数 量 有 异常 上 升 ,就 可 以 认为 该 地 区 已 经 开始 发 生 疫 情 
传播 。 

为 了 充分 挖掘 大 数据 中 存储 的 有 效 信息 ,谷歌 公司 共 测试 了 4.5 亿 个 数 
学 模型 ,并 从 中 确定 最 有 效 的 预测 模型 。 通 常 ,美国 疾 控 中 心 (Centers for 
Disease Control and Prevention,CDC) 公 布 的 疫情 传播 报告 通常 比 实际 传播 
情况 滞后 两 周 。 因 此 谷歌 公司 声称 ,这 套 系统 可 以 比 CDC 更 早 获知 流感 疫 
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情 , 并 且 该 系统 预报 的 疫情 和 官方 公布 的 数据 相关 性 高 达 97%。 虽 然 也 有 
专家 对 此 数据 表示 质疑 ,但 不 可 否认 的 是 ,大 数据 技术 正在 以 我 们 意料 不 到 
的 速度 和 方式 渗透 到 我 们 的 生活 里 ,为 研究 人 类 行为 和 人 与 人 之 间 大 规模 的 
互动 提供 了 朵 新 的 思路 。 

2015 年 1 月 25 日 ,朋友 圈 发 生 了 一 桩 “灵异 ”事件 一 一 一 些 人 发 现 “ 宝 马 
中 国 ? 在 他 们 的 朋友 圈 发 了 一 条 状态 :一些 人 的 朋友 圈 出 现 了 ”vivo 智能 手 
机 ”的 文字 和 图 片 ,而 另 有 一 些 人 的 朋友 轿 则 出 现 了 "可口可乐 ”。 很 快 真相 
大 白 , 原 来 在 这 一 天 ,已 经 积攒 了 5. 49 亿 用 户 的 微 信 , 正 式 启动 了 基于 朋友 
圈 大 数据 分 析 的 新 型 广告 推送 (图 5. 5)。 


宝马 中 国 推广 可口可乐 失 加 em f 

越 是 期 待 已 久 ， 悦 是 如 期 而 至 ， 团 加 年 味 ， 就 要 可 口 可 乐 。 乐 训 极 智 ， 向 音乐 致 收 。 与 尔 一 起 ,认真 对 竺 
每 一 段 音乐 

查看 详情 查看 详情 


查看 详情 


小 % ”区 国 轩 可 国 
1 本 加 二 5 


55 微 信 朋 友 圈 的 第 一 条 广告 


8 分 多 有 


与 传统 广告 全 面 铺 开 的 传播 方式 相 比 , 微 信 试图 通过 用 户 大 数据 分 析 ， 
把 广告 推送 给 可 能 会 感 兴趣 的 用 户 。 通 过 用 户 的 注册 信息 、 绑 定 的 手机 号 和 
GPS 定位 ,可 以 判断 出 用 户 所 在 地 ,通过 朋友 圈 里 分 享 的 帖子 , 则 可 以 分 析 
出 用 户 的 职业 特点 兴趣 爱好 等 ,钱包 支付 记录 则 体现 出 用 户 的 消费 水 平 , 卡 
包 里 各 种 会 员 卡 体现 出 用 户 的 品牌 倾向 , 除 此 之 外 ,在 朋友 圈 的 点 赞 、 留 言 也 
都 可 以 体现 出 用 户 的 个 性 和 偏好 等 。 这 些 庞大 的 用 户 行为 数据 如 同一 座 宝 
藏 , 微 信 可 以 通过 不 同 的 算法 了 解 到 用 户 的 特点 和 需求 ,从 而 推算 出 用 户 感 
兴趣 的 东西 。 
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算法 ,点 石 成 金 的 力量 


你 把 数据 拷问 到 一 定 程度 时 , 它 自 然 就 会 坦白 一 切 。 
一 一 罗 纳 德 。 科 斯 , 诺 贝尔 经 济 学 奖 获得 者 
大 数据 并 不 等 于 大 价值 ,就 像 开采 矿藏 一 样 , 没 经 过 开采 的 数据 仅仅 是 
一 堆 数据 。 而 借助 算法 ,才能 挖掘 出 大 数据 中 烤烟 生 辉 的 珍宝 。 算 法 ,赋予 
了 大 数据 生命 ,让 数据 可 以 为 我 们 所 


二 
o 
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随 着 数据 规模 的 增 大 和 复杂 程度 的 提升 ,人 类 自身 的 力量 变 得 越 来 越 渺 
小 ,如 此 规模 的 数据 显然 是 人 力 难以 处 理 的 ,所 以 只 能 求助 于 计算 机 和 数据 
处 理 算法 。 实 际 上 ,在 大 数据 面前 ,简单 的 算法 也 往往 因为 效率 太 低 而 难以 
奏效 ,于 是 人 们 寄 希 望 于 计算 机 可 以 自己 学 习 大 数据 中 存储 的 信息 ,这 就 是 

从 “机 器 学 习 ” 这 个 名 字 不 难看 出 ,这 门 科学 研究 的 就 是 如 何 使 机 器 具备 
学 习 能 力 , 进 而 掌握 知识 具备 智能 。 可 以 说 ,机 器 学 习 的 终极 目标 就 是 人 工 
智能 。 机 器 学 习 的 产生 和 发 展 与 人 工 智能 技术 的 发 展 息息相关 ,其 应 用 范围 
也 主要 集中 在 人 工 智能 领域 。 

这 两 年 人 工 智能 步 入 了 蓬勃 发 展 的 阶段 。 但 是 ,人 工 智 能 从 诞生 到 现 
在 ,也 经 历 过 三 起 三 落 , 既 获得 过 人 们 热切 的 期 盼 , 也 经 历 过 漫长 的 寒冬。 人 
工 智能 的 历史 ,是 一 部 群星 璀璨 、 高 潮 迭 起 的 历史 。 
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作为 一 门 科学 ,人 工 智 能 诞生 于 1956 年 的 达 特 茅 斯 (Dartmouth) 会 议 。 
这 次 会 议 上 ,相关 领域 的 科学 家 就 这 门 学 科 的 名 称 达 成 一 致 , 即 Artificial 
Intelligence(AT) ,并 且 明 确 了 人 工 智 能 研究 的 任务 。 

人 工 智能 自 诞生 以 来 ,大 致 经 历 了 三 个 阶段 ,分 别 是 推理 期 .知识 期 和 学 
习 期 。 

从 20 世纪 50 年 代 中 期 到 70 年 代 初期 ,可 以 称 为 人 工 智能 的 “推理 期 ”。 
由 于 达 特 茅 斯 会 议 的 影响 ,这 一 阶段 人 工 智能 得 到 了 大 量 资金 投入 ,受到 了 
业界 .政府 和 学 术 界 的 广泛 关注 ,这 是 人 工 智 能 发 展 的 黄金 时 期 。 然 而 ,就 如 
同 大 多 数 新 技术 成 长 过 程 往往 充满 曲折 一 样 ,人 工 智 能 也 是 如 此 ,人 们 慢 慢 
发 现 他 们 当初 的 乐观 预期 迟 迟 无 法 实现 。 于 是 ,20 世纪 60 年 代 后 期 ,人 工 
智能 研究 渐渐 步 入 低谷 。 

20 世纪 70 年 代 中 后 期 到 80 年 代 中 期 ,是 人 工 智 能 发 展 的 第 二 个 阶 
段 一 一 “知识 期 *?。 当 时 ,以 爱德华 . 费 根 鲍 姆 (Edward Feigenbaum) 为 代表 的 
科学 家 提出 ,让 机 器 拥有 智能 的 前 提 是 使 机 器 拥有 知识 。 于 是 ,“ 知 识 处 理 ” 和 
“知识 工程 ”成 为 人 工 智能 的 主流 研究 方向 ,“ 专 家 系统 ”(Expert System) 开 始 被 
大 家 接受 。 专 家 系统 是 具备 专业 知识 的 计算 机 智能 程序 ,可 以 扮演 领域 专家 
的 角色 。 专 家 系统 带动 了 和信 工 智能 的 再 次 繁荣 。1981 年 ,日 本 启动 了 以 面向 
知识 处 理 为 主要 目标 的 “第 五 代 计算 机 ”计划 。 然 而 , 随 着 研究 深入 ,人 们 发 现 
知识 的 表示 是 一 件 很 困难 的 事 。 于 是 ,知识 工程 进入 瓶颈 期 ,第 五 代 计算 机 ” 
预先 设 定 的 目标 也 没 能 按期 实现 。 与 此 同时 ,由 于 世界 范围 内 经 济 泡沫 破裂 ， 
人 工 智 能 再 次 进入 低潮 ,进入 了 人 工 智 能 的 “寒冬 期 ”。 

20 世纪 90 年 代 后 期 ,人 工 智能 进入 "学 习 期 ”。 知 识 的 表示 是 一 个 难 
题 ,那么 能 不 能 让 机 器 自己 学 习 知识 呢 ? 在 这 个 阶段 ,机 器 学 习 融合 了 符号 
主义 和 联结 主义 ,成 为 人 工 智能 研究 主流 ,产生 了 很 多 让 人 眼前 一 亮 的 成 果 。 
目前 ,机 器 学 习 已 经 成 功 应 用 到 计算 机 视觉 .自然 语言 处 理 、 搜 索引 擎 .语音 
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和 手势 识别 等 诸多 领域 。 

尽管 人 工 智能 步 入 学 习 期 的 时 间 还 不 长 ,但 使 机 器 具备 学 习 能 力 却 是 人 
类 一 直 以 来 的 梦想 。 在 人 工 智 能 诞生 之 前 ,就 有 人 对 机 器 学 习 进 行 了 技术 探 
索 ,其 中 的 一 位 代表 性 人 物 就 是 香农 。 

1916 年 4 月 30 日 ,现代 科学 史上 最 为 独特 的 科学 家 一 一 香农 诞生 于 美 
国 密歇根 州 。 香 农 性 格 乐观 开朗 ,年 轻 时 曾 有 过 骑 着 独 轮 车 要 着 四 个 瓶子 在 
贝尔 实验 室 招 扬 过 市 的 霸气 之 举 。 香 农 一 生 学 术 涉猎 非常 广泛 ,本 科学 习 数 
学 ,硕士 期 间 研究 布尔 代数 和 电子 电气 ,博士 期 间 研 究 生物 遗传 学 和 代数 学 ， 
二 战 时 推进 了 密码 通信 的 进步 ,二 战 后 创立 了 一 门 帮 新 的 科学 一 一 信息 论 。 

二 战 期 间 , 香 农 是 为 战争 服务 的 科学 家 小 组 的 一 员 。 当 时 ,他 主要 负责 
的 是 盟国 之 间 的 保密 通信 ,还 曾 保障 过 罗斯 福 
与 丘吉尔 的 越 洋 通话 。 与 香农 一 起 为 战争 服务 
的 还 有 “图 灵机 ”模型 的 提出 者 图 灵 , 图 灵 的 主 
要 工作 是 破解 德国 的 通信 和 密码。 尽管 工作 内 容 
有 一 定 的 相似 性 ,但 是 由 于 严格 的 保密 规定 ,两 
人 相互 并 不 知道 对 方 的 研究 内 容 。 虽 然 不 能 透 
露 工作 内 容 , 但 是 两 人 经 常 在 午餐 时 间 共 同 讨 图 56 香农 和 他 的 迷宫 
论 一 些 有 意思 的 话题 。 有 一 次 他 们 聊 到 了 
Thinking Machine 的 话题 ,就 是 让 机 器 具备 思考 能 力 。 这 个 话题 刺激 了 香农 
的 创新 神经 ,于 是 他 考虑 真正 实现 一 个 具备 思考 和 学 习 能 力 的 机 器 ,这 就 是 
著名 的 “老鼠 迷宫 (图 5. 6)。 

迷 宣 的 主体 是 5 行 5 列 的 方 格 阵列 ,每 个 方 格 中 都 有 一 个 可 以 固定 目标 
的 插 孔 , 方 格 之 间 用 可 以 插 拔 的 “墙壁 ? 隔 开 。 迷 富 中 的 目标 可 以 用 针 辐 定 在 
迷宫 中 的 任何 一 个 方 格 中 。 迷 富 的 主角 是 一 只 四 处 嗅 探 的 “老鼠 ”。 老 鼠 由 
两 个 电机 驱动 ,一 个 电机 负责 前 后 移动 ,一 个 电机 负责 左右 移动 。 老 鼠 在 方 
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格 中 行走 ,寻找 它 的 目标 。 寻 找 过 程 中 老鼠 可 以 感知 到 墙壁 的 存在 , 磁 到 南 
墙 就 回头 。 
这 只 老鼠 具备 三 种 能 力 , 一 是 记忆 ,二 是 寻找 ,三 是 忘却 。 

所 谓 “ 记 忆 ”, 是 指 这 只 老鼠 可 以 记 住 之 前 走 过 的 路 ,找到 目标 后 ,还 会 把 
整 条 路 线 记 在 脑海 里 。 当 然 ,老鼠 是 通过 大 量 继 电器 的 开关 状态 实现 记忆 功 
能 的 ,一 旦 断 电 记忆 就 会 清 零 。 老 鼠 行 走 到 一 个 方 格 中 心 时 ,会 根据 * 记 忆 ” 
中 的 路 线 决定 行进 方向 ,决策 机 制 如 下 : 

如 果 目 标 就 在 当前 的 格子 A 中 ,老鼠 就 停止 行进 ,点 亮 一 音信 号 灯 , 接 
通 警 报 器 ,告诉 它 的 主人 香农 : 我 找到 目标 啦 ! 向 主人 卖 靖 的 同时 , 它 还 会 
把 起 点 到 目标 的 路 线 记 下 来 ,这 可 是 它 以 后 偷懒 的 本 钱 ! 如 果 把 老鼠 再 次 放 
到 起 点 方 格 中 ,老鼠 会 很 快 沿 着 相同 路 线 轻松 找到 目标 。 

如 果 当 前 格子 A 中 没有 目标 ,但 老鼠 发 现 这 个 格子 是 记忆 中 “偷懒 路 
线 ” 的 一 环 , 那 么 它 就 果断 开启 偷懒 模式 ,试图 通过 偷懒 路 线 到 达 目 标 。 

如 果 目 标 不 在 当前 格子 A 中 ,并 且 格子 A 也 不 是 “偷懒 路 线 ” 的 一 环 , 或 
者 老鼠 记忆 中 根本 就 还 没有 所 谓 的 “偷懒 路 线 ” ,那么 老鼠 就 只 能 采取 最 策 的 
方法 了 。 它 选择 一 个 方向 做 试探 ,如 果 碰 了 壁 就 退回 方 格 中 央 , 逆 时 针 旋 转 
90° 继 续 尝试 ,直到 顺利 走 到 下 一 个 方 格 B。 对 于 走 过 的 每 一 个 方 格 ,老鼠 会 
况 是 ,老鼠 在 这 


它 就 只 能 退回 上 一 个 格子 继续 探索 。 

在 这 个 策略 的 驱动 下 ,老鼠 通常 会 找到 一 条 到 达 目 标的 路 ,但 是 在 特定 
情况 下 ,老鼠 也 会 陷入 某 种 “神经 质 ” 的 状态 。 例 如 在 老鼠 记忆 中 ,从 格子 A 
出 发 ,经 过 格子 B 和 格子 C 可 以 到 达 目 标 所 在 的 格子 D。 如 果 把 迷宫 稍 做 修 
改 , 使 得 从 C 出 发 无 法 到 达 DD, 但 可 以 到 达 格 子 ,而 经 过 格子 记 又 恰好 可 以 
到 达 格 子 A。 这 时 ,老鼠 就 会 进入 A-B-C-E-A-B-C-E 的 循环 中 。 
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如 何 解 决 这 个 问题 呢 ? 这 是 一 只 擅长 偷懒 的 老鼠 ,所 幸 它 也 是 一 只 聪明 
的 老鼠 。 如 果 在 24 次 移动 后 还 没有 到 达 目 标 ,老鼠 会 认为 迷宫 结构 已 经 发 
生 了 变化 , 它 会 果断 忘掉 曾经 的 “偷懒 路 线 ”, 放 空心 灵 , 重 新 开始 迷宫 冒险 
之 旅 。 

图 5.7 是 迷宫 的 设计 图 ,图 中 右 下 角 是 香农 名 字 的 缩写 “C. E. S. ”, 中 间 
部 分 是 迷宫 的 主要 部 件 一 一 25 个 方 格 , 上 方 是 负责 老鼠 左右 移动 的 电机 , 左 
侧 是 负责 老鼠 前 后 移动 的 电机 ,下 方 是 由 按钮 .开关 和 拨 片 组 成 的 控制 面板 ， 
右上 角 的 同心 圆 代表 老鼠 寻找 的 目标 。 


图 57 迷宫 结构 图 


从 现在 的 眼光 来 看 ,这 个 迷宫 功能 比较 简单 ,老鼠 的 破解 能 力 和 学 习 能 
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力也 比较 有 限 , 甚 至 不 能 保证 可 以 找到 到 达 目 标的 最 短路 线 。 可 是 不 要 忘 
了 ,这 个 迷宫 诞生 在 电子 管 和 继电器 的 时 代 , 那 时 现代 意义 的 计算 机 还 没有 
诞生 ,C 语言 等 编程 语言 也 还 没有 发 明 。 香 农 创造 的 这 个 迷宫 具备 了 “记忆 ” 
“寻找 ”和 “忘却 ”能 力 , 老 鼠 的 大 脑 就 是 一 个 简单 的 “算法 ”。 这 个 迷宫 体现 了 
香农 卓越 的 学 术 水 平 ,以 及 他 在 使 机 器 具备 学 习 能 力 方向 所 做 的 思考 。 

机 器 学 习 是 一 门 涉 及 统计 学 、 概 率 论 ,最 优化 理论 .计算 复杂 性 理论 等 多 
个 学 科 的 综合 学 科 。 目 前 ,机 器 学 习 并 没有 统一 的 定义 。 人 工 智 能 先驱 亚 
巷 : 塞 穆 尔 (Arthur Samuel) 认为 ,机 器 学 习 的 研究 目的 是 使 计算 机 在 没有 
被 显 式 编程 的 前 提 下 具备 学 习 能 力 。 另 外 一 个 更 加 常用 的 定义 是 由 机 器 学 
习 专 家 、 美 国 工程 院 院 士 汤姆 米 切 尔 (Tom Mitchell) 给 出 的 : 如 果 计 算 机 
程序 借助 以 往 的 经 验 可 以 使 自己 的 性 能 变 得 更 好 ,这 时 我 们 就 认为 这 个 程序 
具备 了 学 习 能 力 。 

谈 起 机 器 学 习 时 ,我们 要 区 分 两 个 概念 : 机 器 学 习 算法 和 机 器 学 习 。 机 
器 学 习 算法 ,是 使 计算 机 具备 学 习 能 力 的 算法 。 机 器 学 习 , 是 设计 和 分 析 机 
器 学 习 算法 的 学 科 。 

大 体 来 说 ,机 器 学 习 算 法 可 以 分 为 有 监督 算法 (Supervised learning ) 与 
无 监督 算法 (Unsupervised learning) 两 大 类 。 两 类 算法 的 主要 区 别 在 于 , 作 
为 输入 的 数据 是 否 带 有 标签 (Label)。 若 要 求 所 有 数据 都 带 有 标签 , 那 就 是 
有 监督 学 习 ; 若 所 有 数据 均 不 带 标 签 ,就 是 无 监督 学 习 。 
什么 是 数据 的 标签 呢 ? 简单 地 说 ,就 是 对 于 数据 性 质 的 说 明 。 以 国内 革 
音乐 软件 为 例 ,对 于 听 到 的 每 一 首 歌曲 ,用 户 都 可 以 做 出 收藏 .删除 .下 一 首 
等 操作 。 这 样 ,软件 就 可 以 根据 用 户 操作 为 音乐 生成 一 个 标签 : 喜欢 ( 单 击 
“收藏 按钮) 一般 ( 听 完 歌曲 而 不 做 任何 操作 ) .不 太 喜 欢 ( 单 击 “ 下 一 首 ” 按 
钮 或 者 讨厌 ( 单 击 “ 删 除 ” 按 钮 );。 后 台 运 行 的 机 器 学 习 算法 可 以 对 带 有 标签 
的 数据 进行 学 习 , 明 确 用 户 的 偏好 ,精确 推送 用 户 可 能 喜欢 的 歌曲 。 这 就 是 


169 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


个 典型 的 有 监督 学 习 的 例子 (图 5. 8) 。 


图 58 某 音乐 软件 界面 以 左 到 右 分 别 是 收藏 ” 
噜 除 ”下 一 首 " 和 其 他 功能 ”) 


在 医学 领域 ,医生 们 遇 到 疑难 杂 症 时 ,常常 阅读 相关 的 文献 来 寻找 以 往 
的 类 似 病例 和 治疗 方案 ,为 解决 临床 问题 提供 思路 ,这 个 过 程 称 为 系统 性 回 
顾 (Systematic Review)。 在 系统 性 回顾 中 ,最 耗 时 、 最 乏味 同时 也 最 重要 的 
一 个 步骤 就 是 文献 筛选 ,就 是 从 大 量 文献 中 筛选 出 真正 有 用 的 部 分 。 通 常 ， 
每 2000 一 5000 份 文献 中 只 有 200 一 500 份 文献 最 为 相关 ,比例 不 足 10%。 以 
往 , 文 献 筛选 通常 由 人 工 完成 ,往往 会 耗费 大 量 的 人 力 和 时 间 。 

美国 社会 保障 局 (United States Social Security Administration) 曾经 主 
导 了 一 个 医学 项 目 , 旨 在 研究 残疾 儿童 中 低 出 生体 重 、 发 育 不 良和 身材 矮小 
之 间 的 关联 。 这 个 项 目 交 给 塔 夫 茨 大 学 的 循 证 医学 实践 中 心 (Tufts 
Evidence-based Practice Center) ,他 们 需要 筛选 33 000 篇 文献 。 一 个 资深 的 
文献 筛选 员 可 以 在 一 分 钟 之 内 阅读 两 篇 文献 的 摘要 并 进行 筛选 ,这 意味 着 筛 
选 5000 篇 文献 需要 40 个 小 时 的 不 间断 工作 ;而 某 些 星 当 难 懂 的 文献 可 能 需 
要 数 分 钟 才 能 完成 筛选 ,这 会 使 得 所 需 时 间 大 大 增长 。 

为 了 解决 这 个 问题 , 塔 夫 茨 大 学 计算 机 科学 系 的 研究 人 员 提出 ,使 用 一 
个 有 监督 的 机 器 学 习 算 法 完成 文献 篇 选 工 作 。 首 先 , 请 医学 专家 筛选 出 数 篇 
文献 ,这 相当 于 对 一 部 分 文献 加 了 标签 “相关 ?或 “不 相关 ”; 然后 由 机 器 学 习 
算法 对 筛选 好 的 文献 进行 学 习 , 并 对 剩 下 未 筛选 的 文献 进行 预测 分 类 。 经 测 
试 , 人 类 专家 只 需 对 50 篇 文献 做 筛选 ,机 器 学 习 算法 就 可 以 达到 93%% 的 得 
选 准 确 率 , 并 且 筛 选 工作 可 以 在 一 天 之 内 完成 。 


170 


第 5 章 算法 , 让 数据 有 了 价值 


当然 ,数据 量 过 大 时 ,为 所 有 数据 增加 标签 是 不 可 行 的 ,于 是 无 监督 学 习 
算法 应 运 而 生 。 无 监督 学 习 算法 一 个 常用 的 场合 是 为 数据 分 类 。 例 如 ,搜索 
引擎 的 新 闻 分 类 显示 功能 ,后 台 运行 的 可 能 就 是 一 个 无 监督 学 习 算 法 。 每 天 
世界 上 都 会 发 生 海量 的 新 闻 事件 ,这 些 新 闻 不 可 能 由 人 手动 设置 标签 。 无 监 
督 的 机 器 学 习 算法 可 以 自动 对 新 闻 进 行 学 习 、 分 类 。 谷 歌 公 司 在 其 网 站 上 注 
明 :“ 所 有 新 闻 的 选择 ,排序 ,分 类 和 搜索 均 由 电脑 程序 自动 决定 ”( 见 图 5. 9)。 


内 地 
we 仓 林 - 太 想 赢 全 队 都 有 些 急 申 先 失 球 2 响 了 心态 
三 rr 二 

新 浪 体 育 讯 10 月 6 日 晚 . 2018 年 世界 杯 预选 赛 亚洲 区 12 强 赛 展 开 和 3 轮 的 争夺 ,中国 田 足 在 主场 西安 0-1 不 笋 撤 利 亚 
科技 队 。 春 后 国足 前 锋 部 林 接 受 了 疼 体 记者 的 采访 ， 抒 林 雪 示 这 场 对 阵 撤 利 亚 的 比赛 国足 配合 方面 
国足 Vs 叙利亚 首发 : 部 休 手 档 张 玉 宁 丁 海峰 落选 


Go tothe U.S. Edition 


sre (rend RE 计 3 有 Hantanesreoon， 
59 谷歌 新 闻 界 面 


1996 年 ,美国 数学 家 、 物 理学 家 、 计 算 机 科学 家 大 卫 ' 沃 尔 珀 特 (David 
Wolpert) 提 出 了 一 个 著名 定理 一 一 “没有 免费 的 午餐 ”定理 (No Free Lunch 
Theorem) 。 这 条 定理 表明 ,一 个 算法 不 可 能 在 所 有 问题 上 都 表现 得 很 好 , 算 
法 在 解决 某 类 问题 时 性 能 的 提升 ,是 以 在 解决 其 他 问题 时 性 能 下 降 为 代价 
的 ,不 存在 满足 所 有 需求 的 “万 金 油 ”。 这 条 定理 给 机 器 学 习 的 启示 是 ,没有 
一 个 机 器 学 习 算法 可 以 擅长 学 习 所 有 的 模式 。 对 于 具体 问题 ,还 需要 具体 分 
析 , 设 计 出 适合 的 机 器 学 习 算法 。 虽 然 如 此 ,我 们 仍然 可 以 期 待 技术 的 发 展 
为 我 们 带 来 相对 通用 的 算法 组 件 ,通过 这 些 组 件 可 以 组 合 、. 训 练 出 具有 特定 
j 途 的 机 器 学 习 算法 。 
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搜索 算法 


如 何 海底 寻 针 


20 世纪 90 年 代 以 前 ,互联 网 的 用 户主 要 是 军 方 和 科研 机 构 , 网 络 上 的 
信息 也 很 少 。 所 以 ,这 个 阶段 人 们 并 没有 什么 搜索 信息 的 需求 。 这 就 好 比 去 
一 家 便利 店 买 东西 ,因为 店面 很 小 ,货物 很 少 ,所 有 货物 一 目 了 然 ,我 们 很 容 
易 找到 自己 需要 的 东西 。1992 年 ,万 维 网 的 出 现 打破 了 这 一 局 面 ,网 站 制作 
和 发 布 网 页 信息 的 成 本 急剧 下 降 , 普 通用 户 浏览 信息 的 成 本 也 急剧 降低 , 互 
联网 上 的 信息 开始 快速 增长 。 在 信息 快速 增长 的 情况 下 ,用 户 想 找到 自己 要 
看 的 网 页 内 容 变 得 越 来 越 困 难 。 

1994 年 ,斯坦福 的 三 名 在 校生 建立 了 一 个 名 为 雅虎 (Yahoo) 的 网 站 ,他 
们 自己 将 互联 网 上 重要 的 站 点 分 门 别 类 整理 成 一 个 导航 目录 ,并 把 这 个 导航 
目录 放 到 雅虎 网 站 上 ,方便 用 户 快速 找到 希望 访问 的 网 站 (图 5. 10)。 雅 虎 
一 经 推出 就 获得 了 市 场 的 认可 ,用 户 渐渐 形成 了 首先 访问 雅虎 然后 再 访问 其 
他 网 页 的 习惯 。 这 就 好 比 去 一 家 沃尔玛 超市 买 东西 ,店面 很 大 ,货物 很 多 ,我 
们 必须 通过 分 类 指示 牌 才能 找到 所 需 货物 摆 放 的 货架 ,雅虎 正 是 起 到 了 分 类 


Yahoo - A Guide to WWW 


St Hie? | Woes Oo? Whats Penda? | Sls | A Emdom la ] 


图 510 Yshoo 19%4 年 的 界面 
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指示 牌 的 作用 ,为 我 们 寻找 “货物 ?指明 了 方向 。 

随 着 互联 网 上 的 信息 爆炸 式 增长 ,分 类 目录 越 来 越 力 不 从 心 , 从 图 5. 10 
中 可 以 看 到 ,Business 类 别 中 有 6426 个 不 同 的 网 址 ,用 户 要 从 这 么 多 不 同 的 
网 址 中 寻找 自己 想 看 的 内 容 实 在 是 太 困难 了 。 即 使 已 经 收录 了 这 么 多 网 址 ， 
仍然 有 绝 大 多 数 的 网 址 不 能 被 收录 。 另 一 方面 ,分 类 目录 只 能 告诉 用 户 信息 
存放 在 哪里 , 却 难 以 显示 出 信息 的 细节 。 如 果 你 想 在 沃尔玛 买 几 斤 澳洲 大 龙 
虾 ,通过 货架 上 方 分 类 指示 有 牌 只 能 知道 虾 摆 放 在 哪个 货架 上 ,至 于 那里 到 底 
有 没有 大 龙虾 ,大 龙虾 是 否 是 澳洲 产 的 更 是 无 从 得 知 。 你 必须 穿 过 长 长 的 过 
道 , 走 过 一 排 排 货架 ,来 到 摆 放 虾 的 货架 ,经 过 一 番 肉 眼 搜寻 后 ,才能 知道 到 
底 有 没有 你 想 要 的 澳洲 大 龙虾 。 这 是 多 么 糟糕 的 体验 啊 ! 

面 对 分 类 目录 的 缺陷 ,用 户 渴望 一 种 更 好 的 搜索 工具 。 用 户 渴望 搜索 工 
具 能 够 像 哆 啦 A 梦 那 样 神通 广大 ,全 世界 所 有 的 东西 都 装 在 它 的 兜 里 ,只 要 
说 要 一 个 名 字 , 哆 啦 A 梦 立 刻 从 名 里 掏 出 来 ,而 不 用 像 在 超市 货架 上 找 货物 
那样 费时 费力 ,运气 不 好 时 还 极 有 可 能 找 不 到 ,无 功 而 返 。 

1995 年 3 月 ,搜索 领域 的 两 位 传奇 人 物 谢 尔 盖 ， 布 林 (Sergey Brin) 和 
拉 里 ， 佩 奇 (Larry Page) 在 斯 坦 福 大 学 相遇 了 。 对 , 没 错 ,又 是 斯 坦 福 大 学 ! 
当时 正 值 互联 网 大 潮 , 两 人 决定 从 信息 检索 技术 入 手打 造 一 番 事 业 。 布 林 和 
佩 奇想 创造 这 样 一 个 工具 , 它 能 收录 全 世界 所 有 的 网 页 ,只 要 用 户 发 出 查询 
词 ,能 马上 从 海量 的 网 页 中 找到 用 户 需要 的 那个 。 

在 布 林 和 佩 奇 之 前 , 有 人 将 文本 检索 用 到 了 互联 网 搜索 领域 ， 
AltaVista、Excite 就 是 这 类 搜索 引擎 的 代表 。 他 们 采用 了 经 典 的 信息 检索 模 
型 ,例如 布尔 模型 .向量 空 间 模 型 或 者 概率 模型 ,来 计算 用 户 查询 关键 词 与 网 
页 文本 内 容 的 相关 程度 。 与 分 类 目录 相 比 ,这 种 方式 能 收录 大 部 分 网 页 ,并 
能 按照 网 页 内 容 和 用 户 查询 的 匹配 程度 进行 排序 。 然 而 ,文本 检索 有 一 个 很 
大 的 问题 ,就 是 搜索 质量 不 是 很 好 。 
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为 什么 文本 检索 质量 不 好 呢 ? 我 们 来 分 析 一 下 其 中 缘由 。 文 本 检索 只 
考虑 网 页 内 容 和 用 户 查 询 关键 词 的 匹配 程度 , 却 不 关心 网 页 内 容 的 质量 。 通 
过 下 面 的 例子 你 就 会 明白 这 是 一 件 多 么 糟糕 的 事情 。 有 一 位 未 婚 姑 娘 请 一 
个 婚介 公司 为 她 介绍 未 婚 男子 ,姑娘 提出 的 要 求 是 又 高 又 帅 ,那么 如 果 婚 介 
公司 把 身材 最 好 .长相 最 帅 的 男子 推荐 给 她 就 是 最 好 的 推荐 吗 ? 呵呵 ,这 可 
不 一 定 哦 ! 因为 除了 身高 和 长 相 , 对 一 个 男子 的 评价 标准 还 有 很 多 ,包括 年 
龄 学历. 家庭 背 景 、. 职 业 、 性 格 , 收 入 等 ,也 许 身 材 最 好 .长相 最 帅 的 男子 是 一 
个 又 穷 又 策 又 懒 的 男人 ,那么 姑娘 还 是 会 对 这 个 推荐 非常 不 满 。 同 样 道理 ， 
与 用 户 查 询 词 最 匹配 的 网 页 未 必 质 量 最 佳 ,用 户 仍然 有 可 能 对 这 个 文本 上 所 
匹配 的 查询 结果 感到 失望 。 基 于 文本 检索 的 搜索 引擎 显然 不 是 大 雄 想 要 的 
哆 啦 A 梦 , 试 想 一 下 ,如 果 大 雄 想 吃 苹果 , 哆 啦 A 梦 从 兜 里 掏 出 了 一 只 腐烂 
发 臭 的 苹果 ,大 雄 会 是 什么 心情 ! 

如 何 才 能 找到 文本 内 容 既 匹配 ,质量 又 很 靠 谱 的 网 页 呢 ? 布 林 和 佩 奇 觉 
察 到 文本 检索 方式 遗漏 了 一 个 重要 的 信息 。 互 联网 上 的 海量 网 页 并 不 是 
立 的 ,它们 之 间 通 过 链接 彼此 相连 ,这 些 链 接 关系 一 定 隐 含 着 某 种 意义 ,而 文 
本 检索 从 未 利用 过 这 些 链 接 关 系 。 也 就 是 说 ,信息 不 仅 存在 于 网 页 之 中 , 互 
联网 中 网 页 之 间 的 逻辑 关系 也 隐藏 着 很 多 对 我 们 有 用 的 信息 。 

佩 奇想 出 了 一 个 名 为 PageRank 的 奇妙 算法 。 这 个 算法 后 来 成 为 人 类 
抗击 信息 泛滥 的 一 件 强 有 力 的 法 宝 , 它 使 搜索 引擎 的 质量 大 幅 提升 , 堪 称 搜 
索引 擎 算法 的 开山 鼻祖 。1999 年 佩 奇 发 表 的 关于 PageRank 算法 的 论文 迄 
今 已 被 引用 超 一 万 次 。 汤 森 路 透 (Thomson Reuters) 公 司 在 2014 年 10 月 所 
做 的 一 项 统计 表明 ,人 类 历史 上 发 表 的 总 共 5800 万 篇 SCI 检索 论文 中 , 仅 有 
14 499 篇 论文 的 引用 次 数 超过 1000 次 ,而 引用 次 数 达到 12 119 次 便 可 跻身 
百 强 榜 。PageRank 算法 在 学 术 领 域 的 重要 地 位 可 见 一 

那么 ,这 个 传奇 的 PageRank 算法 到 底 是 怎么 工作 的 ? 我 们 先 从 一 个 人 
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物 影响 力 排名 的 案例 来 领悟 PageRank 的 核心 思想 。 如 图 5. 11(a) 所 示 ,我 
们 要 对 A、B.C.D.E 等 5 个 人 的 影响 力 排 名 。 我 们 用 箭头 表示 这 5 个 人 之 
间 的 认识 关系 ,例如 A 有 两 个 箭头 分 别 指向 B 和 D, 这 表明 A 认识 B 和 D。 
注意 这 里 的 认识 关系 是 单 向 的 ,例如 我 们 大 家 都 认识 美国 总 统 特 朗 普 ,可 是 
他 并 不 认识 你 。 


(c) 第 二 步 (d) 最 终 状态 


图 51 人 物 影响 力 排 名 


那么 我 们 如 何 知 道 一 个 人 的 影响 力 到 底 有 多 大 呢 ? 

我 们 假定 5 个 人 的 影响 力 之 和 是 1, 每 人 的 影响 力 值 最 初 都 是 0. 2。 
我 们 刚才 说 过 ,被 越 多 的 人 认识 影响 力 就 会 越 高 ,那么 我 们 就 制定 这 样 一 
个 规则 ,每 个 人 都 把 自己 的 影响 力 值 均 分 给 自己 认识 的 人 。 例 如 A 的 影响 
力 初始 值 是 0.2,A 认识 B 和 D, 那 么 A 就 把 自己 的 影响 力 值 均 分 给 B 和 
D, 各 给 0. 1 。 
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按照 这 样 的 算法 ,我 们 就 能 对 5 人 的 影响 力 做 排名 了 。 具 体 计算 过 程 是 
这 样 的 ,如 图 5.11(a) 所 示 ,5 人 的 影响 力 初始 值 都 是 0. 2; 在 图 5. 11(b) 中 ， 
每 个 人 都 把 自己 的 影响 力 值 均 分 给 了 所 有 自己 认识 的 人 ,于 是 A.B`C、.D 和 
下 的 影响 力 值 分 别 更 新 为 0.2.0.4.0.1.0.1 和 0.2; 我 们 再 把 图 5. 11(b) 中 
每 个 人 的 影响 力 值 作为 初始 值 , 重 复 上 述 影 响 力 值 的 均 分 过 程 ,就 会 得 到 
图 5. 11(c) 所 示 的 结果 :不 断 重 复 ,5 个 人 的 影响 力 值 最 终 不 再 变化 ,分 别 是 
0.29.0.29.0. 14.0.14 和 0.14。 这 时 ,我 们 发 现 A 和 C 的 影响 力 明 显 高 于 
其 余 三 个 人 。 

通过 上 面 的 计算 ,我 们 可 以 得 出 两 个 规律 : 第 一 ,认识 你 的 人 越 多 ,你 的 
影响 力 就 越 大 。 在 上 述 5 个 人 中 ,认识 C 的 人 高 达 3 个 ,而 其 他 人 仅 被 1 一 2 
个 认识 ,难怪 C 的 影响 力 会 这 么 高 ;第 二 ,认识 你 的 人 影响 力 越 大 ,那么 你 的 
影响 力也 越 大 。 尽 管 A、B、D 都 是 只 被 一 个 人 认识 ,但 A 的 影响 力 却 比 B.D 
都 高 ,甚至 连 被 两 人 认识 的 玉 都 比 不 过 A。 

上 面 的 案例 利用 人 物 之 间 的 认识 关系 来 计算 人 物 影响 力 , 而 刚刚 提 到 的 
PageRank 算法 则 是 利用 网 页 之 间 的 链接 关系 来 计算 网 页 权威 值 。 如 果 把 
图 5.11 中 的 5 个 人 蔡 换 成 5 个 网 页 ,把 认识 关系 换 成 链接 关系 ,那么 网 页 A 
就 有 两 个 链接 分 别 指向 网 页 B 和 D。 网 页 之 间 的 链接 关系 和 各 自 的 权威 值 
如 图 5. 11(a) 所 示 , 多 次 重复 人 物 影响 力 排名 中 的 迭代 过 程 ,5 个 网 页 的 权威 
值 就 会 收敛 到 图 5. 11(d) 所 示 的 结果 。 

你 是 不 是 觉得 这 个 算法 计算 过 程 很 简单 ,简直 不 敢 相信 它 就 是 成 就 了 
Google 搜索 霸业 的 神奇 算法 ! 图 5. 12 是 Google 在 1998 年 推出 的 Beta 测 
试 版 本 的 界面 ,与 Yahoo 对 比 一 下 ,目录 进化 成 了 一 个 输入 框 ,你 想 查 什么 
就 在 输入 框 里 输入 什么 , 剩 下 的 就 交 给 PageRank 算法 了 。 终 于 我 们 第 一 次 
进入 了 可 以 自由 搜索 的 Web 世界 。 

到 目前 为 止 ,学 术 界 已 经 提出 了 很 多 种 基于 链接 关系 分 析 的 搜索 算法 ， 


176 


第 5 章 算法 , 让 数据 有 了 价值 


Google: 


Search the web ung ] 


Copyngh ©1998 0oot lne 


图 512 ”Google 198 年 的 界面 


除了 PageRank 外 , 另 一 个 具有 代表 性 的 链接 分 析 算 法 称 为 HITS。 

HITS 算法 的 全 称 是 Hyperlink-Induced Topic Search, HITS 算法 是 由 
康 奈 尔 大 学 的 Jon Kleinberg 博士 于 1997 年 首先 提出 的 。HITS 几乎 与 
PageRank 同一 时 期 被 提出 ,HITS 算法 同样 以 更 精确 的 搜索 为 目的 ,直到 今 
天 仍然 是 一 个 优秀 的 算法 。HITS 算法 到 底 是 如 何 工作 的 ? 为 了 便于 理解 ， 
我 们 还 是 暂且 不 谈 网 页 搜索 这 么 深奥 的 问题 ,而 是 从 一 个 故事 中 领悟 HITS 
算法 的 精妙 所 在 。 

话说 北京 城 里 有 四 位 爷 们 打算 一 起 在 外 面 操 一 顿 ,可 是 最 发 息 的 就 是 去 
哪儿 吃 。 他 们 决定 从 东 来 顺 、 大 鸭 梨 、 黄 记 煌 、 必 胜 客 和 海底 捞 中 选 一 家 ,可 
是 这 4 个 人 意见 并 不 一 致 。 最 后 只 能 投票 来 决定 , 哪 家 得 票 最 高 就 去 哪 家 。 
图 5. 13 就 是 他 们 的 投票 情况 ,有 3 人 选 东 来 顺 ,3 人 选 大 鸭 梨 ,1 人 选 黄 记 
煌 ,2 人 选 必 胜 客 ,2 人 选 海底 捞 , 所 以 这 5 家 餐馆 的 得 票 分 别 是 3、.3、1.2、2， 
也 就 是 说 东 来 顺和 大 鸭 梨 都 是 3 票 ,并 列 第 一 ,还 是 没 法 确定 去 哪 一 家 。 

这 时 ,二 和 区 有 个 提议 ,他 说 :“ 咱 们 每 个 人 品位 高 低 不 一 ,不 应 该 把 4 个 
人 的 选择 都 看 成 一 样 的 ,要 重点 考虑 品位 高 的 那个 人 的 推荐 。” 因 为 这 4 个 人 
都 自 调 是 吃 遍 天 下 无 敌手 的 资深 吃 货 ,在 品位 上 谁 也 不 肯 服 谁 。 当 大 和 区、 二 
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大 区 二 和 爷 三 区 四 和 爷 餐馆 得 分 
7 


东 来 顺 | 之 忆 | 3 pT 
大 鸭 巢 | 咏 | 咏 | 3 20 
黄 记 煌 3 EE 6 
必胜客 | 之 忆 | 2 15 
海底 捞 © |2 13 
8 6 6 水 
推荐 者 “水 平 ” 


图 513 餐馆 选择 问题 


和 苑 、 三 区 正 吵 得 不 可 开交 的 时 候 , 四 条 突然 有 了 一 个 主意 :“ 一 个 人 推荐 的 餐 
馆 越 受 欢 迎 ,说 明 他 的 水 平 越 高 ,对 不 对 ?大 家 点 头 表示 玩 同 。 四 和 苑 接着 说 : 
“好 ,既然 大 家 都 同意 , 那 我 们 就 用 一 个 人 所 推荐 的 餐馆 的 得 票 总 数 来 评价 他 
的 水 平 ,怎么 样 ? 比如 二 哥 , 共 推荐 了 3 家 餐馆 : 大 鸭 梨 、 黄 记 煌 和 海底 捞 ， 
这 三 家 餐馆 的 总 得 票 是 3 十 1 十 2 二 6, 那 么 他 的 水 平 就 是 6 分 ,同样 道理 ,大 
哥 、 三 第 和 我 的 水 平分 别 是 8 分 .6 分 和 7 分 。” 用 所 推荐 的 餐馆 的 得 票 总 数 
来 评价 推荐 人 的 水 平 确实 是 个 客观 公正 的 好 办 法 ,大 家 都 对 这 个 方法 心服 口 
服 。 于 是 大 家 开始 重新 计算 各 餐馆 的 得 分 ,这 一 次 将 推荐 人 的 水 平 作为 权重 
来 计算 每 家 餐馆 的 得 分 。 比 如 东 来 顺 的 得 分 是 8 十 6 十 7 二 21, 同 样 道理 ,大 
鸭 梨 、 黄 记 煌 、 必 胜 客 和 海底 捞 的 得 分 分 别 是 20.6、15 和 13。 这 样 东 来 顺 就 
比 大 鸭 梨 领先 1 分 ,最 后 他 们 就 高 高 兴 兴 地 去 东 来 顺 吃 测 羊 肉 啦 ! 

这 个 选 餐 馆 的 故事 ,通俗 易 懂 地 讲 清楚 了 HITS 算法 的 精妙 之 处 。 那 么 
HITS 搜索 算法 实际 是 如 何 运 行 的 呢 ? 

假设 我 们 要 搜索 的 关键 词 是 “newspaper”。 图 5. 14 中 左边 是 与 
“newspaper” 字 面相 关 的 网 页 ,右边 是 它们 所 指向 的 网 页 ,得 到 的 “票数 ”是 指 
共 被 多 少 个 网 页 所 指向 。 如 同 在 餐馆 推荐 中 可 以 用 餐馆 的 得 票数 反 过 来 评 
价 推荐 者 的 水 平 , 如 图 5. 15 所 示 ,我 们 也 可 以 用 网 页 的 “票数 " 反 过 来 评估 左 
边 指 向 它们 的 “推荐 者 ”的 分 量 。 然 后 ,我 们 就 可 以 像 选 餐馆 时 将 推荐 水 平 作 
为 权重 来 计算 餐馆 得 分 那样 ,如 图 5. 16 所 示 , 也 考虑 推荐 者 分 量 , 用 加 权 评 
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tl 


分 的 方法 重新 评估 右 侧 网 页 的 得 分 。 我 们 用 图 5. 16 中 右 侧 网 页 的 新 得 分 下 
次 反 过 来 评价 左 侧 “推荐 者 ”的 分 量 , 然 后 用 新 的 “推荐 者 ”分 量 加 权 评 分 会 得 
到 右 侧 网 页 的 新 得 分 ,如 此 循环 反复 下 去 , 右 侧 网 页 的 得 分 就 会 收敛 到 某 个 
固定 值 。 最 终 搜索 引擎 就 会 把 得 分 最 高 的 几 个 网 页 呈现 给 用 户 


o 


图 5 人 5 HI 算法 的 第 2 步 


这 就 是 HITS 算法 的 全 过 程 。 我 们 发 现 它 与 餐馆 推荐 方法 唯一 的 区 刚 
就 是 要 循环 反复 几 次 罢了 。 

HITS 算法 认为 每 个 网 页 都 具有 两 面 性 : 权威 性 和 中 枢 性 。 如 果 一 个 
页 被 很 多 网 页 指向 ,表明 其 权威 性 高 ,认可 度 高 ;如 果 一 个 网 页 指向 很 多 
页 ,表明 其 中 枢 性 强 ;如 果 一 个 网 页 被 很 多 中 枢 性 强 的 网 页 指向 ,权威 性 更 
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516 HIS 算 法 的 第 3 步 


高 ;如 果 一 个 网 页 指向 很 多 权威 性 强 的 网 页 ,中 枢 性 更 强 。 权 威 值 其 实 就 是 
图 5. 14 一 图 5. 16 中 右 侧 网 页 的 得 分 ,中 枢 值 其 实 就 是 左 侧 “ 推 荐 者 ”的 分 量 
HITS 算法 最 精妙 之 处 就 是 用 权威 值 反 过 来 计算 中 枢 值 ,再 用 中 枢 值 加 权 计 
算 权威 值 ,循环 反复 ,直至 收敛 。 

作为 搜索 引擎 链接 分 析 的 两 个 最 重要 的 算法 , HITS 算法 和 PageRank 
算法 无 论 是 基本 概念 模型 ,还 是 计算 思路 及 技术 实现 细节 都 有 很 大 不 同 。 忆 
么 HITS 算法 和 PageRank 算法 各 自 有 何 优势 和 劣势 呢 ? 首先 ,HITS 算法 
是 与 用 户 输 入 的 查询 请 求 密切 相关 的 ,而 PageRank 与 查询 请 求 无 关 。 所 以 
HITS 算法 可 以 单独 作为 相似 性 计算 评价 标准 ,而 PageRank 必须 结合 网 页 
内 容 的 相似 性 计算 才能 对 网 页 相关 性 进行 评价 。 其 次 ,HITS 算法 因为 与 
户 查询 密切 相关 ,所 以 必须 在 接收 到 用 户 查 询 后 进行 实时 计算 ,计算 效率 较 
低 ;而 PageRank 则 可 以 在 爬虫 抓 取 网 页 内 容 后 离线 计算 ,运行 时 可 以 直接 
使 用 计算 结果 ,计算 效率 较 高 。 第 三 ,HITS 算法 的 计算 对 象 数量 较 少 ,只 需 
计算 扩展 集合 内 网 页 之 间 的 链接 关系 ;而 PageRank 是 全 局 性 算法 ,需要 对 
所 有 互联 网 页 面 节 点 进行 处 理 。 因 此 ,从 两 者 的 计算 效率 和 处 理 对 象 集合 大 
小 来 比较 ,PageRank 更 适合 部 署 在 服务 器 端 ,而 HITS 算法 更 适合 部 署 在 客 
户 端 。 
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推荐 算法 一 一 给 你 想 要 的 一 切 


本 章 一 开始 提 到 了 互联 网 推荐 系统 , 它 可 以 根据 互联 网 用 户 的 各 种 信 
息 , 向 用 户 推荐 未 来 可 能 感 兴趣 的 信息 。 互 联网 推荐 系统 的 灵魂 ,就 是 推荐 
算法 。 

对 大 部 分 人 来 说 ,因为 音乐 的 存在 ,那些 枯燥 的 时 光 开 始 变 得 轻松 而 美 
妙 。 现 在 我 们 每 天 只 需 通 过 一 个 网 络 音乐 软件 ,就 可 以 收听 到 海量 的 歌曲 ， 
有 时 候 这 些 歌曲 似乎 明白 你 的 心思 一 样 ,播放 出 的 每 一 首 歌曲 都 让 你 尽 然 心 
动 。 这 时 你 也 许 会 通过 音乐 软件 的 界面 点 一 下 “评价 ”按钮 ,表示 喜欢 ,当然 ， 
有 时 候 你 也 会 选择 “删除 ”, 表 示 不 喜欢 。 

现在 我 们 有 很 多 这 种 个 性 化 音乐 电台 ,它们 通过 基于 内 容 的 推荐 算法 ， 
利用 乐曲 之 间 的 相似 性 来 为 用 户 做 推荐 。 这 个 算法 的 原理 很 简单 ,但 是 它 最 
大 的 挑战 在 于 如 何 计算 歌曲 的 相似 度 。 一 方面 ,歌曲 的 数量 庞大 ,而 且 每 天 
还 有 大 量 的 新 歌 诞生 ,分 析 这 些 歌曲 的 特征 是 一 个 浩大 的 工程 ,需要 高 效 的 
大 数据 处 理 算法 支持 。 另 一 方面 ,音乐 的 特征 包含 诸多 方面 ,比如 旋律 .区 
奏 , 编 曲 、 歌 词 . 风 格 等 ,人 类 对 音乐 的 体验 是 一 个 非常 复杂 的 过 程 ,很 难 使 月 
自动 化 的 程序 来 帮 人 类 试听 和 分 辨 乐曲 的 特征 并 做 标记 ,因此 主要 依靠 人 工 
的 方式 。 

2000 年 1 月 6 日 ,车 名 的 音乐 电台 Pandora 曾经 开展 了 一 个 浩大 的 音乐 
基因 工程 项 目 。 音 乐 家 和 研究 人 员 亲 自 听 了 上 万 首 来 自 不 同 歌手 的 歌 , 然 后 
对 歌曲 的 不 同 特性 (比如 旋律 .节奏 、 编 曲 和 歌词 等 ) 进 行 标注 ,这 些 标 注 被 称 
为 音乐 的 基因 。 然 后 ,Pandora 会 根据 音乐 基因 来 计算 歌曲 的 相似 度 ,并 向 
j 户 推荐 与 其 之 前 喜欢 的 音乐 在 基因 上 相似 的 其 他 音乐 。 

下 面 我 们 再 来 看 看 基于 人 口 统计 学 的 推荐 算法 。 当 我 们 在 网 站 上 注册 
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时 ,经 常会 需要 填写 手机 号 码 . 电 子 邮 箱 性别、 年 龄 .职业 等 个 人 信息 。 我 们 
很 少 去 想 网 站 收集 这 些 信 息 会 有 什么 用 ,我 们 只 想 迅速 填写 完 , 尽 快 完成 注 
册 。 我 们 不 曾 想到 ,就 在 我 们 提交 这 些 信息 的 一 刹那 ,网 站 的 老板 在 暗 处 偷 
偷 地 笑 了 ,基于 这 些 信息 ,推荐 算法 已 经 知道 怎么 把 东西 推销 给 我 们 了 。 从 
另外 一 个 角度 来 看 ,这 些 信息 实际 上 暴露 了 我 们 的 个 人 隐私 ,可 能 会 给 我 们 
带 来 不 必要 的 麻烦 。 关 于 隐私 保护 ,本 书 第 7 章 会 详细 介绍 。 

仅仅 利用 这 点 简单 的 信息 就 可 以 吗 ? 也 许 你 对 此 并 不 确信 ,将 信 将 疑 ， 
你 可 能 认为 ,即便 有 点 用 ,其 效果 也 不 会 太 好 。 其 实 , 这 些 信息 远 比 我 们 想象 
的 有 价值 ,性 别 、 年 龄 与 兴趣 的 相关 性 也 非常 高 。 女 生 们 爱 看 有 长 腿 欧 巴 的 
《来 自 星星 的 你 》, 而 男生 们 更 爱 看 惊险 刺激 的 《越狱 >。 尽 管 从 外 表 不 能 明显 
地 区 分 出 80 后 和 90 后 ,然而 一 旦 80 后 和 90 后 一 起 去 K 歌 ,年 龄 就 暴露 无 
遗 。90 后 唱 的 歌 ,80 后 压根 没 听 说 过 ,即便 容颜 未 老 ,80 后 也 已 然 感觉 年 代 
的 鸿沟 ! 

利用 人 口 统计 学 特征 包括 年 龄 .性 别 . 工 作 ,. 学 历 . 居 住地 、 国 籍 .民族 等 
做 推荐 的 算法 , 称 为 基于 人 口 统计 学 的 推荐 算法 。 这 一 算法 是 利用 用 户 之 间 
的 相似 度 来 做 推荐 的 。 如 果 小 兰 和 大 兰 都 是 年 龄 25 一 30 岁 的 年 轻 女性 , 那 
么 她 们 的 兴趣 有 可 能 相似 ,把 小 兰 喜欢 的 电视 剧 推荐 给 大 兰 , 那 么 大 兰 有 可 
能 也 会 喜欢 。 
基于 人 口 统计 学 特征 的 推荐 系统 的 典型 代表 是 布鲁斯 . 克 和 鲁 维 斯 
(Bruce Krulwich) 开 发 的 Lifestyle Finder 系统 。 首 先 , 克 和 鲁 维 斯 将 美国 人 群 
根据 人 口 统计 学 属性 分 成 62 类 ,每 个 注册 用 户 都 需要 填写 个 人 资料 。 算 法 
根据 用 户 资料 判断 他 属于 哪个 分 类 ,最 后 给 他 推荐 这 类 用 户 最 喜欢 的 15 个 
链接 ,其 中 5 个 链接 是 推荐 他 购买 的 商品 ,5 个 链接 是 推荐 他 旅游 的 地 点 , 剩 
下 的 5 个 链接 是 推荐 他 去 逛 的 商店 。 

为 了 证 明 利用 用 户 人 口 统计 学 特征 后 的 推荐 结果 好 于 随机 推荐 的 结果 ， 


182 


第 5 章 算法 , 让 数据 有 了 价值 


克 鲁 维 斯 做 过 专门 测试 。 相 对 于 利用 人 口 统计 学 特征 的 算法 ,他 设计 了 一 个 
实验 组 和 一 个 对 照 组 ,实验 组 看 到 的 推荐 结果 是 个 性 化 推荐 算法 生成 的 ,对 
照 组 用 户 看 到 的 推荐 结果 是 完全 随机 的 。 实 验 结果 显示 ,对 于 人 口 统计 学 特 
征 的 个 性 化 推荐 算法 生成 的 推荐 内 容 , 用 户 点 击 率 为 89%% ,而 随机 算法 推荐 
内 容 的 点 击 率 只 有 27%。 对 于 利用 人 口 统计 学 特征 的 个 性 化 算法 ,44% 的 
用 户 觉得 推荐 结果 是 他 们 喜欢 的 ;而 对 于 随机 算法 只 有 31% 的 用 户 觉 得 推 
荐 结果 是 自己 喜欢 的 。 因 此 ,我 们 得 到 一 个 结论 : 使 用 人 口 统计 学 信息 相对 
于 随机 推荐 能 够 获得 更 好 的 推荐 效果 。 

基于 人 口 统计 学 的 算法 有 一 个 重要 的 用 途 , 就 是 解决 系统 的 冷 启动 问 
题 。 对 于 一 个 新 注册 的 用 户 ,系统 无 法 根据 他 的 历史 行为 ,如 购物 车 记录 、 购 
买 记 录 、 评 价 留 言 推测 他 的 兴趣 ,此 时 利用 新 用 户 注册 时 填写 的 性 别 、 年 龄 、 
内 业 等 信息 就 可 以 做 最 初 的 推荐 ,效果 比 漫 无 目的 的 随机 推荐 强 太 多 了 。 随 
着 用 户 使 用 时 间 的 增长 和 历史 数据 的 积累 ,其 他 的 推荐 算法 才能 有 用 武之 
也 ,从 而 继续 提高 推荐 的 精度 。 

与 基于 人 口 统计 学 特征 的 推荐 算法 类 似 , 微 信 精 准 广告 推送 也 是 基于 对 
户 特 征 的 深刻 了 解 。 据 微 信 称 ,从 推送 对 象 的 角度 ,其 广告 引擎 从 “高 活跃 
度 ”“ 常 参与 广告 互动 ”两 个 评分 维度 中 精 选 了 一 批 “种 子 用 户 ” 作 为 广告 的 第 
一 批 推送 对 象 。 以 他 们 为 中 心 ,挖掘 出 一 批 和 他 们 兴趣 相同 的 好 友 。 这 种 推 
送 策略 大 大 减少 了 广告 对 用 户 体验 地 消极 影响 。 从 传播 逻辑 的 角度 思考 ,你 
的 好 友 对 广告 的 互动 情况 将 影响 你 接收 同一 广告 的 概率 。 例 如 ,你 和 小 马 哥 
是 好 友 , 小 马 哥 看 到 某 条 广告 ,点 赞 或 评论 了 它 , 那 么 你 看 到 这 条 广告 的 概率 
就 会 提升 。 从 推送 策略 上 来 看 ,一 条 朋友 图 广告 在 曝光 后 6 小 时 内 若 未 产生 
互动 ,那么 这 条 广告 将 自动 消失 ;如 果 上 曝光 后 有 互动 ,那么 广告 不 消失 。 一 个 
广告 将 持续 7 天 有 效 ,对 单个 用 户 每 48 小 时 内 只 推送 一 个 广告 。 以 上 几 条 
政策 从 不 同 角度 来 保证 用 户 体验 ,同时 提高 了 受众 定向 的 精准 度 。 
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大 数据 算法 的 新 征程 


计算 机 天 生 就 是 用 来 解决 以 前 没有 遇 到 的 问题 的 。 
一 一 比尔 。 盖 茨 ,微软 公司 创始 人 


滞后 的 大 数据 处 理 能 力 


与 农业 时 代 、 工 业 时 代 甚 至 互联 网 时 代 初 期 的 数据 相 比 , 赛 博 时 代 的 数 
据 规 模 、 复 杂 程 度 、 产 生 速 度 、 强 含 的 信息 量 均 有 质 的 差别 。 一 方面 ,移动 通 
信 技 术 、 物 联网 技术 、IPv6 等 新 技术 从 根本 上 改变 了 数据 产生 方式 ,数据 以 
前 所 未 有 的 速度 和 规模 产生 ,处 理 大 数据 所 面临 的 难度 更 大 ; 另 一 方面 ,每 个 
人 都 是 数据 的 生产 者 和 消费 者 ,人 类 的 经 济 活动 .科学 研究 、 生 产生 活 和 数据 
的 关系 比 以 往 任何 时 候 都 更 加 密切 ,对 大 数据 处 理 提出 了 更 高 的 要 求 。 然 
而 ,目前 的 数据 处 理 能 力 还 不 能 完全 满足 需求 ,尤其 到 了 赛 博 时 代 , 予 盾 更 加 
突出 。 

与 几 十 年 前 相 比 ,经 济 活动 参与 者 的 数量 激增 ,我 国 上 市 公司 数 和 上 市 
股票 数 都 保持 了 高 速 增长 。 根 据 2017 年 1 月 24 日 的 数据 , 沪 市 有 上 市 公司 
1205 家 , 仅 A 股 就 有 股票 1198 支 ,市 价 总 值 291 743. 54 亿 元 ,每 天 的 成 交 量 
就 有 1 384 397 万 股 , 成 交 金 额 1408. 41 亿 元 ,共计 成 交 664. 27 万 笔 。 也 就 
是 说 , 沪 市 开 市 时 ,每 秒 钟 都 有 4. 6 万 笔 交 易 成 交 , 成 交 金 额 约 1000 万 元 。 
股市 的 大 盘 波 动 信息 股票 交易 信息 .股票 价格 信息 等 构成 了 一 个 超大 规模 
的 数据 集合 ,再 加 上 参与 者 行为 数据 的 复杂 变化 , 令 市 场 的 走势 变化 更 加 难 
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以 把 握 ,对 算法 的 要 求 也 就 更 高 。 想 要 处 理 这 些 规模 更 大 、 复 杂 度 更 高 的 大 
数据 ,算法 必须 具备 快速 采集 数据 ,快速 处 理 数据 ,快速 分 析 数 据 的 能 力 ,并 
在 此 基础 上 能 够 快速 做 出 正确 决策 。 

以 国家 的 长 期 宏观 经 济 政策 为 例 , 政 府 通常 需要 评估 当前 的 经 济 状况 。 
在 理想 状况 下 ,我 们 希望 经 济 系统 可 以 实时 统计 全 国正 在 发 生 的 所 有 经 济 活 
动 , 根 据 这 些 经 济 活动 快速 生成 各 项 经 济 指标 ,这 样 才能 真正 准确 地 反映 出 
当前 我 国 的 经 济 状况 。 当 然 ,就 目前 的 技术 手段 来 说 ,这 肯定 是 不 现实 的 。 
当前 常用 的 评估 经 济 状况 方法 有 很 多 种 ,国民 生产 总 值 (Gross Domestic 
Product,GDP) ,消费 者 价格 指数 (Consumer Price Index,CPI) 等 都 是 我 们 耳 
熟 能 详 的 经 济 状 况 评估 指标 。 那 么 这 些 指标 到 底 能 不 能 准确 反映 出 国家 当 
前 的 经 济 状 况 呢 ? 答案 是 否定 的 。 

以 GDP 为 例 。GDP 是 一 个 国家 所 有 常住 单位 在 一 定时 期 内 生产 活动 
的 最 终 成 果 。GDP 的 计算 过 程 高 度 复杂 ,从 覆盖 面 来 说 ,GDP 数值 受到 国民 
经 济 各 行业 经 济 活动 的 影响 , 涵 瘟 政府 投资 、 金 融 交 易 、 进 出 口 、 货 物 买卖 等 
诸多 方面 ;从 数据 来 源 来 说 , 既 需 要 统计 部 门 提供 的 数据 ,还 需要 财税 ,金融 、 
保险 等 各 相关 部 门 的 数据 ;从 计算 方法 来 说 ,GDP 数值 并 不 是 简单 相 加 或 者 
汇总 得 到 的 ,而 是 通过 经 济 普查 .抽样 调查 .虚拟 计算 等 多 种 手段 综合 得 出 
的 。 在 这 种 情况 下 ,国家 通常 每 季度 发 布 一 次 GDP 初步 核算 结果 ,发布 时 间 
通常 滞后 两 个 月 左右 。 每 年 度 对 经 济 数据 核实 后 ,或 者 开展 全 国 性 经 济 普查 
活动 后 ,还 有 可 能 根据 情况 对 已 公布 的 GDP 结果 进行 修订 。 类 似 的 还 有 每 
月 公布 的 CPI 指数 ,尽管 CPI 指数 在 公布 后 通常 不 会 被 修订 ,但 是 其 公布 时 
间 通 常 滞后 三 周 。 

在 宏观 经 济 层面 ,我们 尚 缺 乏 快速 有 效 的 数据 采集 .处理 .分 析 手 段 ,还 
需要 大 数据 处 理 技术 的 进步 和 发 展 。 实 时 性 和 准确 性 就 是 其 中 最 为 常见 的 
冲突 需求 。 由 于 数据 规模 过 大 ,数据 复杂 程度 过 高 ,对 数据 进行 完全 精确 的 
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统计 和 计算 需要 的 时 间 可 能 是 一 个 天 文 数字 ;等 到 我 们 得 出 了 精确 的 计算 结 
果 , 这 个 结果 的 时 效 性 已 经 很 差 , 也 就 没有 很 高 的 存在 价值 了 。 所 以 ,通常 为 
了 保证 在 可 接受 的 时 间 内 计算 出 结果 ,就 要 适当 放松 对 数据 准确 性 的 要 求 ， 
这 样 做 的 结果 就 是 ,我 们 得 出 的 结果 往往 既是 滞后 的 ,又 是 不 准确 的 。 我 们 
就 如 同 还 没有 结 绳 记事 技术 的 原始 先 民 ,在 等 待 这 个 时 代 的 神农 氏 。 


算法 竞赛 的 风险 


虽然 我 们 的 大 数据 处 理 能 力 还 不 能 与 处 理 需求 相称 ,但 是 不 可 和 否认 的 是 
人 类 从 未 因此 停止 努力 。 

在 电影 中 我 们 看 到 有 关 股 市 的 场景 总 是 充满 了 紧张 与 刺激 ,计算 机 屏幕 
上 显示 着 快速 跳动 的 股票 价格 ,股市 大 鲍 目 不 转 睛 地 盯 着 不 断 变化 的 股票 指 
数 , 不 停 地 用 红 蓝 笔 和 尺子 在 纸 上 验 算 着 价格 走向 ,急促 地 打 着 交易 指示 电 
话 , 甚 至 来 不 及 咬 上 一 口 放 在 桌 上 的 汉堡 ,因为 很 担心 一 个 汉堡 的 功夫 就 会 
让 户头 上 的 数字 产生 心 惊 肉 跳 的 变化 。 

当然 ,电影 对 现实 生活 有 升华 和 夸张 的 成 分 。 在 现实 中 的 股市 里 ,大 鳄 
们 如 果真 的 是 这 样 炒 股 , 先 不 说 身体 会 累 垮 ,在 连续 高 强度 的 工作 下 ,人 怎么 
能 保证 做 出 客观 、 精 准 的 决策 昵 ?况且 资本 市 场 瞬 息 万 变 , 操 作 人 员 打 一 个 
哈欠 或 上 个 而 所 都 可 能 浪费 宝贵 的 时 机 ;大 鳄 发 现 机 会 后 还 要 用 电话 通知 手 
下 下 单 , 这 样 层 层 传 达 所 花费 的 时 间 也 很 可 能 会 错失 赚钱 良机 。 金 融 家 们 怎 
么 能 容忍 这 样 的 事情 发 生 呢 ? 

实际 上 ,股市 大 鳄 们 的 雇员 们 根本 不 是 精通 经 济 学 和 金融 投资 的 专家 ， 
在 股市 的 另 一 端 ,与 股市 散户 们 对 弈 的 是 一 台 台 被 算法 赋予 神奇 能 量 的 计算 
机 。 自 20 世纪 70 年 代 起 ,就 有 人 探索 通过 计算 机 实现 全 自动 的 股票 交易 ， 
也 就 是 所 谓 的 程序 化 交易 技术 。 随 着 计算 机 技术 的 发 展 ,股票 交易 所 中 喧嚣 
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的 交易 人 群 ,忙碌 的 黄 马甲 更 是 早已 不 见 踪 影 ,甚至 从 某 种 意义 上 来 说 ,人 类 
已 经 成 为 华尔街 的 看 客 。 在 跳动 的 指数 和 晓 蜂 的 曲线 背后 ,是 一 台 台 计算 机 
和 一 行 行 的 算法 代码 在 发 挥 作用 。 这 些 计算 机 按照 计算 机 专家 们 事先 设 定 
的 算法 ,根据 资本 市 场 的 走势 快速 做 出 判断 和 决策 ,发 起 动 辑 数 千 万 美元 的 
交易 。1986 年 率先 采用 程序 化 交易 的 托马斯 彼得 非 (Thomas Peterffy) 目 
前 已 经 是 全 美 排名 前 100 的 大 富豪 。 彼 得 菲 也 是 Interactive Broker( 盘 透 ， 
简称 1B) 的 创始 人 。 作 为 美国 最 大 的 非 银行 券商 ,从 1977 年 成 立 以 来 ,IB 就 
一 直 全 心 投入 于 程序 交易 科技 的 研发 ,目前 1B 每 天 处 理 超过 全 世界 14% 的 
股票 期 权 交易 量 。 

如 今 ,美国 交易 市 场 有 超过 60% 的 交易 都 是 计算 机 程序 完成 的 。 计 算 
机 的 阅读 速度 .分 析 速 度 和 操作 速度 远 超人 类 ,最 重要 的 是 计算 机 是 绝对 理 
智 的 ,永远 不 会 被 数字 冲 异 头脑 ,永远 不 会 因为 精神 疲劳 做 出 错误 决策 。 股 
市 中 隶属 于 不 同 公司 的 计算 机 按照 各 自 的 算法 紧张 运转 ,在 资本 市 场 这 个 虚 
拟 的 战场 上 激烈 交锋 ,带动 各 种 经 济 指数 波动 前 行 。 

当 越 来 越 多 的 计算 机 算法 参与 到 经 济 活动 中 来 之 后 ,计算 机 的 决策 方 
式 、 计 算 速 度 、 记 忆 力 \ 理 性 程度 等 都 和 人 类 截然 不 同 ,市场 走势 的 变化 规律 
也 随 之 发 生变 化 。 与 前 面 介绍 的 谷歌 公司 推出 的 流感 趋势 预测 类 似 , 在 情绪 
的 驱使 下 人 们 行为 模式 会 发 生变 化 ,而 算法 所 了 解 的 局 面 总 是 表面 的 .局 部 
的 ,因此 算法 做 出 的 决策 也 并 不 会 永远 正确 。 雪 上 加 霜 的 是 , 当 更 多 的 公司 
借助 计算 机 算法 参与 到 自动 交易 中 后 ,为 了 战胜 其 他 公司 的 计算 机 算法 实现 
盈利 ,算法 之 间 的 攻击 和 防守 愈演愈烈 “瞒天过海 交 暗 度 陈仓 的 手段 层 出 
不 穷 。 计 算 机 算法 的 功能 越 来 越 复杂 ,程序 规模 也 越 来 越 庞大 , 随 之 而 来 的 
是 算法 可 靠 性 的 降低 。 程 序 的 错误 会 给 市 场 走 势 带 来 严重 影响 ,并 且 影 响 的 
恶劣 程度 远 远 超过 任何 利空 消息 带 来 的 影响 。 
2012 年 7 月 底 , 美 国 著名 的 做 市 商 骑士 资本 集团 (Knight Capital 
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Group) 对 其 与 纽约 证 券 交易 所 相连 的 程序 化 交易 系统 进行 升级 ,安装 了 一 
个 新 的 软件 模块 。 然 而 ,负责 软件 升级 的 员工 忘记 对 一 台 服 务 器 上 的 废弃 软 
件 模块 进行 更 新 。 这 个 小 小 的 疏忽 ,竟然 给 骑士 集团 带 来 了 始 料 未 及 的 严重 
后 果 。2012 年 8 月 1 日 ,纽约 证 券 交 易 所 开 市 后 的 45 分 钟 内 ,骑士 集团 的 程 
序 化 交易 系统 发 起 了 几 百 万 笔 交易 ,其 中 有 400 多 万 笔 成 交 , 成 交 的 4 亿 股 
股票 的 交易 金额 高 达 66. 5 亿美 元 。 这 些 由 于 程序 错误 发 起 的 异常 交易 导致 
多 支 股票 价格 发 生 离 奇 波动 ,甚至 触发 了 涨 跌 阔 值 ,停止 交易 。 此 次 失误 , 引 
发 了 投资 者 对 于 骑士 资本 集团 的 强烈 质疑 ,并 最 终 导致 该 集团 被 另 一 家 做 市 
商 Getco 吞并 。 

2010 年 5 月 6 日 ,美股 发 生 的 “闪电 崩盘 ?事件 也 印证 了 计算 机 算法 的 
脆弱 性 。 这 一 天 ,美国 市 场 并 没有 什么 特别 的 利好 或 利空 消息 ,各 项 经 济 数 
据 也 没有 什么 值得 太 多 关注 的 地 方 。 然 而 ,从 14 点 42 分 开始 ,美股 如 坐 了 
一 次 惊心动魄 的 过 山 车 。 短 短 5 分 钟 时 间 内 ,道琼斯 指数 从 10 458 点 瞬间 
跌 至 9869. 62 点 。 到 14 点 58 分 ,道琼斯 指数 又 回 到 10 479. 74 点 。 这 次 骨 
盘 造 成 了 极为 恶劣 的 影响 , 埃 森 哲 (Accenture) 咨 询 公 司 开盘 报价 为 41. 94 
美元 ,14 点 50 分 时 股价 竟然 跌 至 零 美元 ,后 收 于 41. 09 美元 。 这 一 天 ,与 埃 
森 哲 有 类 似 经 历 的 上 市 公司 不 在 少数 。 这 次 崩盘 给 了 华尔街 当头 一 棒 。 美 
国 证 券 机 构 专 门 对 此 事 进 行 了 紧急 调查 。 然 而 ,调查 并 没有 确认 间 题 的 源 
头 ,疑似 的 原因 之 一 ,是 花旗 的 一 位 交易 员 在 执行 交易 时 , 误 将 “M”(million， 
英文 意 为 “ 百 万 ”) 错 输 为 了 “B”(billion ,英文 意 为 “十 亿 ? ,这 个 事件 触发 宝 
洁 的 某 个 道 指 成 分 股 和 急剧 下 跌 ,进而 引发 某 些 公司 的 计算 机 算法 发 起 了 自动 
交易 。 而 不 同 公司 的 计算 机 算法 本 就 处 于 竞争 关系 ,算法 之 间 又 相互 触发 、 
相互 影响 ,最 终 竟 形成 雪崩 式 的 暴跌 局 面 。 对 此 ,人 们 普遍 认为 参与 程序 化 
交易 的 计算 机 算法 是 加 剧 崩盘 的 元 凶 。 

也 许 现在 就 把 我 们 的 世界 完全 交 给 计算 机 算法 还 为 时 尚 早 。 然 而 ,这 并 
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不 意味 着 我 们 应 该 抛弃 计算 机 算法 ,反而 更 加 凸显 了 大 数据 处 理 算法 在 赛 博 
时 代 的 重要 性 。 我 们 要 做 的 是 不 断 开 发 更 为 强大 和 更 为 可 靠 的 算法 。 从 当 
前 的 发 展现 状 来 看 ,大 数据 处 理 算 法 尚未 成 熟 ,还 有 很 多 没有 解决 的 问题 , 搜 
索 、 推 荐 .社交 网 络 等 各 方面 都 还 有 进一步 改进 的 空间 。 或 许 深度 学 习 和 人 
工 智能 技术 的 引入 会 使 大 数据 算法 获得 第 二 次 腾飞 。 
作为 智能 经 济 时代 的 第 一 生产 力 ,算法 无 疑 会 帮助 我 们 更 加 深入 地 审视 
经 济 系统 整体 的 运行 状况 ,进而 制定 更 加 及 时 有 效 的 经 济 政策 。 也 许 我 们 不 
应 该 将 大 数据 仅仅 看 做 一 个 单纯 的 技术 问题 或 者 社会 问题 ,因为 它 正在 真切 
地 影响 着 我 们 如 何 观察 和 思考 这 个 世界 ,在 这 个 人 与 数据 共存 的 时 代 中 ,或 
许 我 们 应 该 把 大 数据 当 作 一 种 新 的 世界 观 ,毕竟 ,无 论 人 类 怎么 想 , 大 数据 就 
在 那里 。 
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世界 上 最 大 的 零售 商 , 没 有 自己 的 产品 库存 ;世界 上 最 大 的 内 容 提供 商 ， 
没有 自己 出 版 的 内 容 ; 世 界 上 最 大 的 租车 公司 ,没有 自己 的 出 租车 ;世界 上 最 大 
的 出 租 公 寓 , 也 没有 自己 的 房子 。 这 些 智 能 经 济 特有 的 全 新 模式 得 以 实现 , 关 
键 就 在 于 数据 。 我 们 这 个 时 代 的 数据 正在 对 经 济 产生 前 所 未 有 的 深刻 影响 。 
就 在 本 书 编写 即将 完成 的 2017 年 6 月 ,菜鸟 与 顺丰 发 生 的 数据 接口 之 争 充分 
说 明了 这 一 点 。 

菜鸟 网 络 科技 有 限 公司 是 2013 年 5 月 28 日 ,由 阿里 巴巴 集团 .银泰 集 
团 联合 复 星 集团 . 富 春 集团 ,顺丰 集团 .三 通 一 达 ( 申 通 . 圆 通 . 中 通 、. 询 达 ) ,以 
及 相关 金融 机 构 共 同 合作 组 建 的 。 作 为 中 国 最 大 的 两 家 物流 公司 ,菜鸟 与 顺 
丰 之 间 的 关系 非常 微妙 。 虽 然 顺 丰 和 菜鸟 有 合作 ,但 同时 又 在 搭建 自己 的 快 
递 体系 。2015 年 5 月 ,顺丰 联手 中 通 、 申 通 、 韵 达 和 普 洛 斯 一 起 投资 5 亿 成 立 
“ 丰 介 科技 ”来 与 菜鸟 展开 直接 竞争 。 

2017 年 6 月 1 日 , 灯 鸟 称 ,顺丰 于 当日 凌晨 关闭 了 对 它 的 数据 接口 ,并 


第 6 章 你 的 数据 究竟 该 卖 多 少 钱 


停止 给 所 有 淘宝 平台 上 的 包 历 回 传 物 流 信 息 。 顺 丰 立 即 回应 称 , 丰 党 数据 接 
口 是 菜 鸟 方 关闭 ,因为 顺丰 拒绝 了 向 菜鸟 提供 丰 集 所 有 包 右 信息 (包括 非 淘 
系 订单 ) 的 要 求 ,并 认为 这 是 一 次 有 和 针对 性 的 封杀 行动 。 顺 丰 方 面 认为 “菜鸟 
之 所 以 封杀 顺丰 ,背后 的 原因 是 阿里 方面 一 直 希 望 顺丰 从 腾讯 云 切换 至 阿 
里吉 让 

也 许 菜鸟 和 顺丰 ”* 闸 狂 ? 是 迟早 的 事 。 早 在 事 发 一 年 前 ,京东 创始 人 刘强 
东 就 提 到 了 两 者 之 间 的 矛盾 所 在 :“ 菜 鸟 物 流 就 是 在 为 几 家 物流 公司 搭建 系 
统 ,说 得 好 听 是 提升 这 几 家 快递 公司 效率 ,说 得 难听 点 ,这 几 家 公司 的 大 部 分 
利润 都 是 被 菜鸟 物流 给 吸 走 。” 而 之 所 以 能 吸 走 快递 公司 的 利润 , 本质 在 于 菜 
鸟 改 变 了 快递 公司 的 模式 。 中 通 公 司 曾 在 其 风险 提示 中 提 到 :“ 与 菜鸟 的 合 
作 可 能 会 使 其 提升 成 本 ,削弱 与 终端 客户 的 连接 ,甚至 打破 以 往 的 商业 模 
式 。 这样 下 去 ,最 后 这 些 快递 公司 很 可 能 彻底 沦 为 "跑腿 的 ”, 这 也 是 为 什么 
顺丰 作为 菜鸟 的 早期 发 起 人 ,最 后 却 退出 了 菜鸟 的 原因 。 

菜鸟 推出 的 第 一 个 成 功 的 产品 是 电子 面 单 ,统一 了 商家 和 物流 企业 的 接 
口 和 标准 ,能 实时 计算 出 每 个 包 右 的 路 由 ,经 过 哪个 分 拨 中 心 站点、 收 件 员 ， 
同时 直接 反映 在 三 段 码 上 ,并 实时 监控 。 菜 鸟 物流 云 本 质 是 先 让 快递 公司 上 
阿里 云 , 并 做 系统 拆 分 改造 及 整体 架构 修改 ,菜鸟 可 以 基于 日 志 进 行 全 链 路 
系统 与 业务 监控 ,并 输出 其 五 级 地 址 库 , 经 过 博弈 .动态 规划 、 协 调资 源 来 达 
成 供应 链 全 盘 统 筹 ,提供 整体 解决 方案 。 而 实现 这 些 的 必要 前 提 就 是 掌控 数 
据 , 数 据 的 核心 就 是 标准 ,“ 当 物流 公司 所 有 信息 和 作业 (包括 包装 标准 ), 配 
合 干线 和 仓 配 资源 的 标准 ,再 加 上 阿里 对 于 商 流 的 掌控 ,菜鸟 理论 上 可 以 形 
成 垄断 ,拥有 绝对 话语 权 。” 据 36 氨 采 访 的 业内 人 士 称 。 

未 来 ,快递 公司 的 利润 会 不 会 被 菜鸟 吸 走 ? 当然 是 可 能 的 。 长 远 来 看 ， 
谁 控制 数据 , 谁 就 掌握 了 定价 权 。 例 如 “ 双 十 一 ”, 阿 里 说 快递 定价 多 少 就 得 
多 少 , 你 如 果 不 听 , 那 你 的 一 大 半 业 务 就 没 了 。 
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当 菜鸟 打通 整体 物流 数据 时 ,不 管 是 仓储 还 是 运输 的 调度 .运力 分 配 , 它 
都 拥有 话语 权 和 定价 权 , 所 以 你 很 难 在 这 个 行业 拿 到 最 大 利润 。“ 原 本 物流 
的 主动 权 是 供 方 的 ,现在 已 经 完全 转移 到 了 需求 方 ,之 后 会 转移 到 数据 上 ,从 
人 找 货 变 成 货 找 和 人, 物流、 分 销 、 零 售 的 角色 会 因数 据 而 改变 ”, 银 泰 集团 
CEO 陈晓东 曾 对 菜鸟 的 数据 应 用 如 此 评价 。 通 俗 地 说 ,这 就 像 套 在 脖子 上 
的 绳索 ,你 的 命 掌握 在 别人 手 上 ,这 样 下 去 ,未 来 快递 公司 之 间 的 竞争 将 完 
变 成 价格 竞争 。 作 为 这 些 数据 的 创造 者 和 服务 的 提供 商 , 这 样 的 结局 对 物流 
公司 来 说 ,看 似 不 太公 平 。 

当然 ,我 国 当前 的 物流 行业 仍然 在 发 展 中 ,数据 之 争 也 刚刚 开始 ,对 于 那 
些 想 继续 做 强 的 物流 公司 , 谁 都 不 愿意 轻易 地 将 数据 的 控制 权 拱手 相让 。 尽 
管 这 次 事件 由 国家 邮政 局 出 面 进行 了 调停 ,但 是 未 来 物流 行业 的 竞争 一 定 会 
越 来 越 激 烈 ,这 场 数 据 的 战争 也 仍然 将 继续 下 去 。 行 政 干预 当然 是 一 种 方 
法 ,但 对 于 日 益 发 展 的 新 经 济 来 说 ,这 毕竟 不 是 长 久之 计 。 

目前 来 看 ,为 了 保证 数据 提供 方 的 安全 和 利益 ,保证 市 场 的 持续 、 有 效 运 
转 ,用 数据 交易 实现 数据 共享 是 个 多 赢 的 选择 。 然 而 这 样 做 的 前 提 是 需要 让 
数据 成 为 一 种 能 够 被 市 场 调节 的 商品 ,让 数据 本 身 能 够 创造 价值 的 同时 ,也 
具有 价格 。 首 先 要 面 对 的 现实 问题 就 是 目前 大 数据 应 用 缺少 权威 的 交易 中 
介 , 阿 里 想 拿 顺丰 的 数据 匹配 ,顺丰 想 拿 阿里 的 数据 匹配 , 却 没 有 一 个 公平 、 
合理 又 安全 的 方法 。 随 着 数据 的 战略 价值 和 经 济 价值 越 来 越 高 ,数据 行业 应 
该 出 现 一 个 中 立 的 第 三 方 ,能 够 通过 规范 化 的 市 场 机 制 来 实现 数据 的 流转 和 
共享 。 

在 数据 变现 这 个 领域 ,最 成 功 的 应 用 应 该 是 流量 变现 了 ,这 是 目前 大 多 
数 移动 互联 网 公司 让 数据 产生 价值 的 做 法 。 图 6. 1 给 出 了 互联 网 广告 实现 

图 6. 1 左边 是 流量 变现 ,也 就 是 “流量 变 成 钱 ” 的 故事 : 将 某 网 页 中 的 广 
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流量 变现 流量 + 数据 变现 


图 61 数据 变现 


告 位 以 10 000 元 的 价格 卖 给 某 知 名 剃 须 刀 公 司 。 但 是 ,这 显然 是 个 不 明智 
的 选择 : 该 公司 广告 的 受众 大 多 数 是 男性 ;将 广告 无 差别 地 展示 给 所 有 网 页 
用 户 , 是 对 流量 的 浪费 。 于 是 ,我 们 想 , 如 果 能 像 图 6. 1 右边 那样 ,将 男性 受 

众 留 给 该 公司 ,收取 6000 元 广告 费 , 再 将 女性 受众 留 下 来 ,以 6000 元 卖 给 销 
售 化 妆 品 的 广告 主 , 那 么 总 收入 将 达到 12 000, 比 单纯 的 无 差别 流量 变现 要 
高 。 而 与 此 同时 , 剃 须 刀 公司 和 化 妆 品 广告 主 也 都 很 高 兴 , 因 为 他 们 用 了 
60% 的 成 本 获得 了 同样 的 有 效 受 众 

这 个 方法 的 思路 其 实 很 简单 ,但 如 果 找 不 到 能 把 男性 用 户 和 女性 用 户 区 
分 开 的 办 法 ,这 个 思路 也 没 法 实际 使 用 。 那 如 何 才 能 将 男性 用 户 和 女性 用 户 
区 别 开 来 ,又 如 何 进 一 步 知 道 他 们 有 没有 剃 须 刀 和 化 妆 品 的 需求 吧 ? 这 就 得 
依靠 数据 了 。 所 以 说 ,这 多 出 来 的 2000 元 是 数据 资产 挣 的 钱 ,我 们 称 之 为 数 
据 变现 。 

对 于 提供 广告 位 的 媒体 网 站 来 说 ,数据 提高 了 广告 位 的 利用 率 , 为 网 
站 增加 了 收益 ;对 广告 商 来 说 ,数据 提高 了 其 投放 精准 度 , 使 广告 商 看 得 见 
“经 过 ”广告 位 的 客户 ,有 的 放 矢 。 数 据 的 加 工 、 碰 撞 、 流 通 提升 了 数据 的 
价值 。 
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数据 提供 方 .数据 需求 方 .数据 服务 商 等 多 方 可 以 构建 以 数据 开放 数据 
交易 ,数据 分 析 为 核心 的 综合 性 数据 开放 平台 ,从 而 打造 一 个 生态 圈 。 在 传 
统 行业 ,有 技术 资本 化 ;在 数据 时 代 , 也 可 以 有 数据 资本 化 。 据 (2016 年 中 国 
大 数据 产业 白皮书 ) 不 完全 统计 ,2015 年 我 国 大 数据 相关 交易 的 市 场 规模 为 
33. 85 亿 元 ,预计 到 2016 年 国内 大 数据 交易 市 场 规模 将 达到 62. 12 亿 元 ， 
2020 年 将 达到 545 亿 元 。 数 据 交 易 需求 大 ,政府 也 在 支持 并 推进 数据 交易 ， 
各 个 地 方 交易 所 ,交易 中 心 相继 成 立 ,带动 了 整个 数据 交易 市 场 。 

数据 定价 是 数据 交易 的 核心 技术 难题 。 有 关 数 据 价值 的 更 科学 ,更 深层 
次 的 探究 和 挖 据 ,包括 数据 交易 的 商业 运转 模式 的 探索 都 才刚 刚 开始 


数据 该 如 何 买 卖 


数据 科学 家 是 懂得 获取 、 清 洗 、 探 索 、 建 模 和 解释 数据 的 人 ,还 要 融合 入 
侵 技 术 、 统 计 学 和 机 器 学 习 。 数 据 科学 家 不 仅 要 处 理 数据 ,还 要 把 数据 本 身 
当 作 一 个 五 星 产品 来 对 待 。 

一 一 希拉 里 。 梅 森 ,Fast Forward Labs 创始 人 


萌芽 中 的 数据 交易 产业 链 


2014 年 ,“ 社 工 库 ”这 三 个 字 出 现 了 ,人 们 很 容易 望 文生 义 , 把 它 理解 成 
一 个 公益 组 织 。 但 其 实 ,社工 库 是 一 个 模拟 搜索 引擎 页 面 构 造 的 信息 查询 网 
站 ,分 为 "QQ 密码 查询 “QQ 资料 查询 ”和 “开房 记录 查询 ”三 个 部 分 。 其 中 ， 
QQ 密码 和 QQ 资料 的 查询 需要 输入 想 要 查询 的 QQ 号 ,而 开房 记录 查询 则 


194 


第 6 章 你 的 数据 究竟 该 卖 多 少 钱 


需要 输入 相应 的 身份 证 号 。 当 然 , 这 样 一 个 泄露 隐私 的 网 站 很 快 就 被 人 举报 
了 。 尽 管 被 举报 的 社工 库 网 站 已 经 被 封 , 但 仍 有 多 家 社工 库 仍 然 暗 中 进行 继 
续 运 作 。 各 个 社工 库 所 涉及 的 信息 资料 也 有 些 差别 ,除了 QQ 资料 信息 、 身 
份 证 信息 以 外 ,有 的 社工 库 还 会 有 163 邮箱 .126 邮箱 等 用 户 的 信息 。 

社工 库 只 会 免费 开放 一 小 部 分 信息 查询 内 容 , 想 要 查询 其 他 内 容 , 则 需要 付 
费 。 此 外 ,一 些 社工 库 网 站 还 会 贴 出 广告 ,表示 可 以 出 售 自己 掌握 的 整个 数 
据 库 。 其 中 一 个 社工 库 团队 表示 ,自己 全 部 展示 出 的 数据 库 售 价 1500 元 , 另 
有 腾讯 .阿里 巴巴 、 中 国联 通 、 银 行 等 各 大 网 站 和 论坛 的 “影响 极 大 ”的 数据 
库 。 其 公布 的 数据 库 目 录 列 表 显 示 , 多 家 大 型 网 站 的 用 户 数 据 均 被 其 掌握 。 
该 网 站 团队 表示 ,列表 中 的 数据 * 只 是 本 人 出 售 的 数据 其 中 的 一 小 部 分 ”。 

技术 推动 了 社会 的 进步 ,与 此 同时 ,也 创造 了 新 的 犯罪 手段 。 

2016 年 9 月 7 日 ,中 央 电 视 台 主持 人 撤 贝 宁 接 到 骗子 电话 ,声称 自己 是 
北京 市 公安 局 的 , 撤 贝 宁 涉 嫌 拐 卖 儿童 。 骗 子 虽然 当场 被 识破 ,然而 骗子 是 
如 何 得 到 撤 贝 宁 的 联系 方式 的 呢 ?” 新 京 报 的 记者 曾 上 暗访 个 人 信息 买卖 ,发 现 
在 网 络 上 买 到 个 人 数据 信息 并 非 难 事 。 例 如 , 准 大 学 生 信息 的 价格 为 0. 3 
元 /条 ,其 中 包含 姓名 ,性 别 .出 生年 月 .入 学 时 间 、 身 份 证 号 码 . 手 机 号 码 、 家 
庭 住址 以 及 父母 姓名 和 联系 方式 等 。 

其 实 ,一 个 人 从 出 生 开始 ,他 /她 的 各 种 信息 数据 就 已 经 被 泄露 了 。 骗 子 
利用 这 些 数 据 搜索 到 可 能 的 “被 骗 者 ,然后 广 撤 网 。 除 了 打 电 话 行 骗 以 外 ， 
骗子 甚至 会 收集 .分 析出 你 的 银行 卡 信息 ,假扮 成 服务 员 在 餐厅 里 看 你 结账 
时 输入 的 密码 ,然后 以 迅雷 不 及 掩 耳 之 势 将 你 的 卡 在 一 个 小 黑 盒 里 刷 一 下 ， 
你 的 卡 就 被 成 功 复制 了 。 暴 露 的 密码 让 骗子 可 以 随意 取 走 你 银行 卡 里 的 钱 。 

自 2000 年 以 来 , 随 着 中 国 通信 业 的 快速 发 展 ,通过 掌握 个 人 数据 而 进行 
的 电信 诈骗 就 屡见不鲜 。 掌 握 了 一 个 人 的 数据 ,就 掌握 了 分 析 和 了 解 一 个 人 
的 手段 。 骗 子 的 惯用 伎俩 不 外 乎 是 用 他 知道 的 数据 骗取 你 的 信任 ,引导 你 的 
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行为 。 如 果 我 们 不 能 管理 好 数据 、 善 用 数据 ,其 危害 也 会 随 着 数据 的 增长 而 
变 得 后 患 无 穷 。 

这 里 其 实 有 两 个 问题 ,首先 是 用 户 应 该 能 够 通过 技术 手段 保护 自己 的 隐 
私 数据 ,这 一 点 我 们 将 在 第 7 章 再 继续 讨论 。 其 次 是 当 用 户 不 得 不 向 网 络 运 
营 商 或 者 内 容 服务 商 提供 一 些 隐私 数据 时 ,这 些 数 据 能 够 通过 一 种 合法 、 合 
理 且 公平 的 方式 来 进行 数据 交易 。 实 际 上 ,互联 网 的 全 部 商业 模式 都 是 基于 
用 户 隐私 数据 进行 运作 的 , 当 我 们 免费 使 用 搜索 引擎 带 来 的 便利 时 ,必须 牢 
牢记 住 , 世 界 上 没有 免费 的 午餐 ,搜索 引擎 需要 我 们 的 隐私 数据 来 推送 广告 ， 
从 而 挣 得 收入 来 维持 它 的 运转 。 

下 面 我 们 先 来 看 一 看 数据 交易 平台 的 发 展现 状 。 

2014 年 12 月 31 日 ,贵阳 大 数据 交易 所 成 立 ,随后 ,数据 堂 、Datamall 等 
数据 交易 平台 相继 出 现 , 一 时 之 间 ,“ 忽 如 一 夜 春风 来 , 干 树 万 树 梨花 开 ”。 目 
前 这 些 数据 交易 平台 大 概 可 分 为 三 种 类 型 : 平台 型 .技术 型 和 综合 型 。 

平台 型 数据 交易 平台 只 负责 提供 应 用 编程 接口 进行 数据 交易 ,需求 方 按 
调用 次 数 付费 。 有 淘宝 形式 的 ,如 数 粮 和 数据 宝 , 单 纯 地 为 数据 接口 提供 商 
和 需求 方 提供 一 个 交易 的 平台 ;也 有 聚合 应 用 编程 接口 形式 的 ,如 聚合 数据 、 
SHOWAPI、HaoService, 这 些 平台 会 先 将 数据 提供 商 的 第 三 方 接口 进行 技 
术 统 一 ,需求 方 抓 取 数据 时 ,就 只 需要 面 对 统 一 的 接口 ,从 而 大 大 简化 了 需求 
方 从 不 同 数据 提供 商 获 取 数据 的 复杂 度 。 

技术 型 数据 交易 平台 本 身 就 是 数据 提供 商 , 如 数 多 多 、 发 源 地 .大 海洋 ， 
它们 提供 数据 采集 服务 ,数据 以 数据 包 形 式 出 售 。 需 求 方 可 以 向 平台 明确 提 
出 自己 需要 的 数据 内 容 ,平台 进行 试 采集 ,将 采集 的 样品 数据 给 需求 方 检 验 ， 
如 通过 , 则 进行 数据 采集 ,将 结果 打包 交 给 需求 方 。 

综合 型 数据 交易 平台 ,顾名思义 ,业务 类 型 丰富 ,数据 可 以 以 应 用 编程 接 
口 数据 包 、 定 制 . 众 包 等 不 同形 式 出 售 , 如 数据 堂 . 优 易 数据 都 是 综合 型 数据 
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交易 平台 。 

在 这 些 平 台中 ,数据 主要 以 两 种 形式 进行 交易 : 应 用 编程 接口 和 数据 
包 。 也 就 是 说 ,用 户 可 以 通过 购买 应 用 编程 数据 接口 的 访问 权限 ,以 得 到 自 
主 抓 取 数 据 的 权利 ,而 计 费 标准 ,有 的 按照 抓 取 数 据 的 条 数 ,比如 每 抓 取 
1000 条 数据 多 少 钱 , 有 的 则 按照 接口 开放 时 间 计 费 , 比 如 每 个 月 多 少 钱 ,在 
这 个 月 内 可 以 无 限 抓 取 ;用 户 也 可 以 直接 购买 或 定制 完整 的 数据 包 , 根 据 数 
据 类 型 数据 包 大 小 、 需 求情 况 等 付费 。 

数据 交易 平台 正在 摸索 中 前 行 ,效果 也 是 初 见 其 成 。 

2016 年 1 月 22 日 ,华中 大 数据 交易 所 做 成 了 一 单 截至 当时 国内 最 贵 的 
一 笔 数据 交易 一 一 数 十 万 户 企业 信息 , 卖 出 了 26 万 元 的 价格 。 这 个 数据 库 
里 有 全 国 几 十 万 家 企业 的 司法 市场 .社会 等 方面 信息 ,原本 这 些 数据 分 散在 
工商 、 税 务 等 十 几 个 部 门 ,搜集 起 来 非常 麻烦 。 航 天 信息 公司 购买 了 这 个 数 
据 库 ,获得 了 一 个 共享 的 权限 ,需要 哪个 企业 的 数据 就 直接 检索 ,方便 省 事 。 
当然 ,这 里 卖 出 的 数据 一 定 是 经 过 脱 敏 处 理 的 ,去 掉 了 用 户 隐私 部 分 ,这 是 最 
基本 的 要 求 。 但 是 ,尽管 隐匿 了 隐私 信息 ,仍然 存在 数据 安全 问题 ,比如 数据 
泄露 了 ,或 者 隐匿 得 不 好 , 原 数据 被 发 现 了 ,这 就 涉及 数据 隐私 保护 问题 ,我 
们 将 在 第 7 章 继 续 讨 论 。 

“我 们 花 26 万 元 购买 了 几 十 万 个 企业 信息 的 搜索 权限 ,如 需 扩大 范围 ， 
会 继续 追加 投入 ”, 航 天 信息 是 一 家 上 市 公司 ,国内 电子 发 票 龙头 企业 ,业务 
覆盖 4 亿 个 人 用 户 , 企 业 用 户 接近 1000 万 家 。 “我 们 拥有 很 多 企业 的 经 营 数 
据 ,但 是 企业 信息 其 他 方面 涉及 不 多 ”, 华 中 大 数据 交易 所 搜集 到 的 数据 正好 
与 航天 信息 互补 。 双 方 数 据 整合 后 ,就 更 能 对 企业 了 若 指 掌 。 而 这 些 数据 的 
分 析 结 果 ,在 金融 机 构 开 展 信 贷 业 务 ,企业 选择 合作 伙伴 ,相关 部 门 制定 企业 
政策 时 ,都 可 以 用 来 参考 。 

数据 交易 平台 为 需要 数据 的 企业 .组 织 或 个 人 提供 了 数据 ,买方 利用 数 
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据 达 到 自己 的 目的 。 这 个 过 程 好 比 是 一 家 人 要 做 一 顿 饭 ,数据 便 是 基本 食 
材 , 数 据 交 易 平台 就 是 菜市 场 。 有 的 菜市 场 售 卖 的 是 原始 的 刚 从 地 里 采摘 出 
来 的 蔬菜 , 刚 从 水 里 捞 出 来 的 鱼 , 有 的 则 是 清洗 干净 的 蔬菜 和 已 处 理 的 鱼肉 
半成品 , 剩 下 的 事情 便 由 买 家 自己 来 完成 了 。 如 果 只 是 一 顿 家 常 便 饭 ,那么 
可 以 自己 动手 做 出 一 桌 晚餐 ;但 如 果 是 一 次 家 宴 , 家 里 又 没有 “大 厨 ”", 再 了 
的 食材 也 做 不 出 像样 的 大 餐 , 那 么 就 需要 叫 外 卖 ,或 者 请 一 个 会 做 饭 的 厨师 
来 帮忙 。 

因此 ,除了 需要 能 够 提供 “基本 食材 ”的 数据 交易 平台 ,我 们 还 需要 有 一 
些 外 包 服 务 提供 商 来 提供 数据 处 理 、 数 据 分 析 数据 管理 和 行业 解决 方案 等 
数据 相关 服务 ,这 便 是 数据 服务 商 ,例如 DataEye、TalkingData。 它 们 有 的 上 
自己 采集 的 数据 ,有 的 用 需求 方 提供 的 数据 ,来 实现 数据 服务 。 

数据 服务 商 的 业务 通常 可 以 分 为 数据 管理 平台 数据 管家 和 行业 解决 
方案 。 

数据 管理 平台 用 来 挖掘 数据 中 的 商业 价值 、 进 行 数据 资产 化 ,把 分 散 的 
多 方 数据 进行 整合 纳入 统一 的 技术 平台 ,对 数据 进行 标准 化 和 细 分 。 用 户 可 
以 将 细 分 结果 推 向 现 有 的 互动 营销 环境 。 

数据 管家 从 数据 来 源 、 建 模 、 运 营 及 后 台 处 理 等 多 个 维度 助力 企业 处 理 
数据 资产 ,帮助 企业 实现 盘活 企业 数据 资产 ,提升 企业 管理 效率 、 增 强 数据 变 
现 能 力 、 助 推 新 商业 模式 等 目标 。 

行业 解决 方案 是 提供 产品 战略 .产品 运营 数据 运营 和 收益 评估 的 综合 
性 解决 方案 ,帮助 企业 提高 投入 产 出 比 ,从 而 创造 更 多 的 商业 价值 。 

有 菜 、 有 料 、 有 人 做 ,才能 完成 一 道 美味 的 佳 看 。 数 据 服 务 商 补 齐 了 数据 
商品 的 周边 服务 , 细 化 了 市 场 分 工 , 让 专业 的 人 去 做 专业 的 事情 ,这 样 数据 市 
场 的 良性 产业 链 才 能 逐渐 形成 。 
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一 个 健康 有 序 的 数据 交易 市 场 需要 哪些 参与 者 


数据 交易 的 需求 日 益 增 大 ,这 些 数据 的 需求 方 究竟 利用 数据 来 做 什 
么 呢 ? 

最 常见 的 数据 需求 便 是 估计 一 件 事 物 的 价值 和 对 比 多 件 事物 的 价值 。 
对 需求 方 来 说 ,数据 市 场 就 相当 于 一 个 数据 仓库 。 他 们 利用 数据 市 场 提供 的 
数据 ,例如 来 自 网 页 的 “开放 数据 ”, 以 及 非 公开 源 , 例 如 来 自 路 透 社 的 商业 数 
据 和 内 部 私人 数据 ,来 进行 商业 估 值 。 需 求 方 制定 描述 “事物 ”价值 的 关键 指 
标 , 例 如 广告 位 的 关键 指标 包括 点 击 量 、 位 置 、 大 小 等 。 最 后 ,需求 方 利 用 这 
些 关 键 指 标的 数据 对 这 些 事物 进行 排名 。 关 于 数据 的 需求 ,还 有 一 些 有 趣 的 
场景 ,例如 ,网 络 论坛 对 购买 德国 宝马 汽车 的 客户 的 决策 有 多 大 影响 力 ? 在 
高 排名 和 用 户 经 常 光 顾 的 “男士 剃 须 刀 ”网 页 ,广告 商 应 该 购买 哪个 广告 空 
间 ? 某 明 星 的 广告 推荐 能 达到 多 大 的 宣传 作用 ,有 多 少 转化 成 了 购买 力 ? 

还 有 一 种 数据 需求 是 收集 关于 某 事物 的 事实 信息 ,并 基于 事实 信息 建立 
相互 联系 。 几 十 年 来 ,这 种 情况 在 信息 集成 中 是 众所周知 的 ,也 在 文本 挖 握 
和 信息 检索 中 有 着 重要 意义 。 简 单 地 说 ,如 果 你 想 深入 了 解 一 件 事物 ,那么 
最 好 的 方式 ,就 是 知道 它 的 相关 数据 , 越 多 越 好 。 不 管 你 是 用 它 来 分 析 、 应 
,还 是 了 解 ,数据 都 是 最 直接 的 突破 口 。 

数据 的 价值 需要 市 场 里 不 同 角色 的 人 共同 努力 才能 挖掘 出 来 。 了 解数 
据 市 场 中 的 需求 ,利益 和 不 同 受 益 人 的 需求 ,对 数据 的 定价 策略 至 关 重 要 。 
图 6.2 展示 了 目前 数据 市 场 的 基本 结构 。 

数据 市 场 的 参与 者 可 大 体 分 为 如 下 七 类 。 

第 一 类 是 分 析 师 。 充 当 分 析 师 角色 的 典型 成 员 是 各 领域 的 专家 ,如 并 购 
专家 、 销 售 主管 .产品 经 理 , 营 销 经 理 和 业务 分 析 师 。 这 些 专 家 最 常 使 用 的 数 
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图 62 数据 市 场 


据 挖 掘 工具 是 Web 搜索 引擎 。 这 些 人 利用 办 公 产 品 (Word、Excel、 
PowerPoint 等 ) 汇 总 数据 探索 的 结果 ,形成 报告 ,以 直观 、 易 懂 的 方式 展示 给 
领导 或 大 众 。 从 数据 市 场 的 角度 来 看 ,这 个 群体 试图 从 公共 可 用 数据 (大 部 
分 来 自 互 联网 ) 商业 数据 (商业 来 源 ) 和 私人 数据 的 无 限 选择 中 受益 。 为 此 ， 
分 析 师 们 向 数据 源 发 出 即时 查询 ,并 以 高 度 交 互 的 方式 组 合 数据 ,然后 将 数 
据 源 和 数据 集成 转化 成 文字 , 变 成 大 家 都 能 读 懂 的 知识 。 

第 二 类 是 应 用 程序 供应 商 。 分 析 师 可 能 并 不 会 编程 序 ,他 们 精湛 的 分 
析 、 严 密 的 逻辑 和 多 样 的 需求 在 计算 机 眼 里 只 是 毫 无 意义 、 错 乱 失 常 的 电流 。 
对 数据 的 探索 是 一 项 包含 许多 繁杂 而 重复 步骤 的 任务 ,如 果 让 分 析 师 来 完成 
会 极 大 地 降低 分 析 师 的 工作 效率 ,而 程序 员 可 以 将 分 析 师 的 常见 需求 转化 为 
应 用 程序 。 这 些 应 用 程序 简化 并 加 速 了 任务 的 进行 ,帮助 不 同 领域 的 专家 完 
成 分 析 。 从 数据 市 场 的 定价 角度 来 看 ,这 种 做 法 将 会 促进 稳定 数据 和 服务 的 
产生 ,同时 在 应 对 连续 需求 上 也 将 有 所 帮助 ,从 而 保障 数据 市 场 健康 有 序 的 
发 展 。 
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第 三 类 是 数据 关联 算法 的 开发 人 员 。 需 求 方 获得 的 数据 通常 来 自 大 
的 、 不 稳定 的 数据 源 ,应 用 程序 供应 商 和 分 析 师 需要 集成 ,处理 这 些 数据 , 侦 
如 ,数据 挖掘 匹配、 清理 ,相关 性 计算 和 沿袭 跟踪 。 不 同 的 步骤 会 应 用 不 同 
的 算法 。 对 于 不 同类 型 .不 同 领 域 的 数据 ,这 些 算法 的 “质量 ”或 “可 加 入 性 ” 
是 不 同 的 ,并 且 通 常 仅 适 合 特定 的 领域 。 开 发 人 员 可 以 将 这 些 算 法 包装 成 黑 
盒 (用 户 定义 的 函数 ) 放 到 数据 市 场 ,这 样 一 来 ,其 他 参与 者 便 可 以 “购买 ?这 
些 算 法 ,然后 只 需 通过 函数 调用 就 可 以 实现 复杂 的 功能 了 。 

第 四 类 是 数据 提供 者 。“ 巧 妇 难 为 无 米 之 炊 ”, 数 据 提供 商 的 存在 是 数据 
市 场 得 以 存在 的 前 提 。 这 里 我 们 将 数据 提供 商 分 为 商业 和 非 商 业 的 。 商 业 
的 数据 提供 商 既 有 像 Google、 百 度 这 样 提供 网 络 搜索 引擎 的 商家 ,也 有 来 自 
网 络 论坛 的 链接 数据 提供 商 , 还 有 销售 多 年 积累 的 金融 数据 和 地 理 数 据 的 商 
业 数 据 提供 商 , 如 路 透 社 或 彭 博 社 等 。 非 商业 的 数据 提供 商 有 政府 机 构 、 联 
合 国 组 织 或 世界 银行 ,它们 会 免费 提供 统计 数据 。 当然, 一 些 数据 提供 商 也 
开始 提供 将 不 同 数据 集成 在 一 起 的 算法 ,兼职 数据 服务 商 。 

第 五 类 是 顾问 。 分 析 师 不 是 万 能 的 ,对 于 特定 的 专业 领域 ,他 们 也 需要 
咨询 ,以 便于 在 数据 源 选择 、 集 成 ,评估 和 产品 开发 方面 做 决策 。 这 时 候 , 顾 
问 便 可 以 解决 特定 领域 的 专业 问题 。 

第 六 类 是 许可 和 认证 实体 。 我 们 都 知道 买 商品 的 时 候 不 能 买 三 无 产品 ， 
也 就 是 无 生产 日 期 .无 质量 合格 证 以 及 无 生产 厂家 的 产品 。 数 据 商品 也 一 
样 。 在 数据 市 场 上 ,我 们 也 需要 许可 和 认证 ,有 人 称 之 为 “品牌 标签 ”, 用 来 帮 
助 客户 购买 数据 相关 产品 。 

第 七 类 是 数据 市 场 监管 。 如 前 所 述 ,数据 市 场面 临 着 技术 .伦理 法 律 和 
经 济 方面 的 挑战 。 如 何 建 立 一 个 值得 信赖 的 品牌 和 大 型 社区 ;如 何 开发 用 于 
存储 、 搜 索 .交换 数据 以 及 相关 算法 的 公共 平台 ,同时 最 小 化 算法 执行 时 间 ， 
如 何 制定 公平 公正 又 适用 于 市 场 的 法 律 法 规 ,这 些 都 是 挑战 。 数 据 市 场 监管 
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的 存在 可 以 帮助 参与 者 们 从 宏观 的 角度 战胜 这 些 挑战 ,使 数据 市 场 有 条 不 率 
地 运转 。 


给 数据 定价 是 个 技术 活 


有 价值 的 东西 只 有 对 懂得 的 人 才 有 意义 。 
一 一 普 劳 图 斯 , 剧 作家 

上 面 我 们 提 到 ,贵阳 率先 成 立 了 全 国 第 一 家 大 数据 交易 所 ,但 是 成 立 后 
发 现 了 一 个 严重 的 问题 , 那 就 是 怎么 给 数据 定价 。 数 据 和 普通 的 商品 不 太一 
样 , 它 能 以 很 低 的 成 本 复制 ,然后 卖 给 很 多 人 ;并 且 , 买 家 和 卖家 往往 都 不 清 
楚 它 究竟 会 产生 多 少 价值 。 中 国 大 数据 金融 产业 创新 战略 联盟 常务 副 理事 
长 范 晓 忻 说 :“ 现 在 很 多 企业 ,政府 都 拥有 大 量 数据 ,但 这 仅 是 “数据 大 ”而 
不 是 大 数据 。 真 正 的 大 数据 ,是 需要 进行 演算 .评估 等 ,而 且 这 些 数据 就 像 未 
知 的 矿藏 ,存在 一 定 风险 ,通过 演算 后 可 能 在 应 用 中 并 不 存在 什么 价值 ”这 
是 个 复杂 而 新 笑 的 问题 。2016 年 1 月 8 日 ,贵阳 成 立 了 大 数据 资产 评估 实 
验 室 ,这 也 是 全 国 第 一 家 大 数据 资产 评估 实验 室 。 

成 立 当 天 ,实验 室 就 正式 发 布 了 对 人 民 日 报 媒体 技术 股份 有 限 公司 “ 传 
播 效果 评估 系统 ”的 数据 资产 评估 成 果 。 大 数据 资产 评估 实验 室 与 人 民 日 报 
媒体 技术 公司 签约 ,将 “传播 效果 评估 系统 ”作为 数据 产品 进行 分 析 评 估 。 评 
估 认 为 ,该 大 数据 服务 对 于 一 家 中 等 规模 媒体 机 构 每 年 的 价值 为 50 万 到 80 
万 元 ,而 面 对 全 国 众多 机 构 用 户 ,将 产生 亿 元 级 的 数据 服务 价值 。 

根据 麦肯锡 对 西方 产业 数据 的 评估 ,大 数据 能 使 欧洲 发 达 国 家 政府 节省 
至 少 2000 亿 欧 元 的 运作 成 本 ,每 年 给 欧盟 带 来 400 亿 欧 元 的 经 济 增长 ;使 美 
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国医 疗 保健 行业 降低 8% 的 成 本 ;并 使 得 大 多 数 零售 商 的 营业 利润 率 提高 
60% 以 上 ,帮助 制造 业 在 产品 开发 .组 装 等 环节 实现 约 50% 的 成 本 消减 。 

数据 为 政府 和 产业 带 来 了 巨大 的 价值 ,那么 如 何 对 数据 的 价值 进行 衡量 
进而 定价 呢 ? 数据 是 否 能 够 按照 一 定 的 计量 单位 来 计算 每 工 .每 G 数据 多 少 
钱 , 每 一 干 条 数据 记录 多 少 钱 , 每 张 图 片 、 每 条 语音 分 别 都 多 少 钱 ? 

讨论 这 一 问题 之 前 ,我 们 需要 清楚 ,这 里 所 说 的 “定价 ” 指 的 是 确定 数据 
的 价格 ,而 非 价 值 。 “数据 如 何 定价 ”并 不 完全 等 同 于 “数据 值 多 少 钱 ”, 也 就 
是 说 数据 的 价值 并 不 等 同 于 它 的 价格 。 


价值 也 可 以 有 “ 粹 "有 量 


数据 的 价值 是 什么 ? 是 推荐 一 款 产品 ,是 读 懂 一 个 客户 ,还 是 计算 一 种 
人 生 ? 也 许 ,数据 价值 是 发 现 一 一 发 现 你 原来 并 不 知道 的 问题 ,然后 帮助 你 
提供 解决 问题 的 方法 和 思路 ;又 或 许 , 数 据 的 价值 是 自我 认 知 。 

如 果 这 些 都 是 数据 的 价值 ,我 们 又 怎么 去 判断 哪 一 种 价值 更 大 呢 ?” 如 果 
数据 的 价值 能 用 1、2、3…… 这 样 的 数字 来 表示 就 简单 多 了 ,这 样 我 们 就 能 轻 
松 地 判断 齐 大 剖 小 了 。 

然而 , 真 的 能 有 这 样 一 种 方法 吗 ? 

首先 ,我们 来 考虑 数据 本 身 的 价值 所 在 。 很 多 大 数据 的 专家 都 说 过 : 数 
据 本 身 是 没有 价值 的 ,真正 有 价值 的 是 从 数据 中 提取 获得 的 信息 。 什 么 是 信 
息 呢 ?“ 张 三 姓 张 。 我 们 会 说 这 句 话 毫 无 信息 量 。“ 卡 文 迪 许 姓 卡 。 "我们 会 
说 这 句 话 的 信息 是 错误 的 。 事 实 上 ,我们 平常 对 信息 的 判定 ,是 经 过 人 脑 根 
据 信息 传递 目标 和 心理 预期 等 因素 判断 的 ,这 种 判定 常常 是 因地制宜 的 ,人 
们 大 多 考虑 的 是 信息 的 意义 。 而 从 科学 的 角度 研究 信息 时 ,这 个 “信息 ”就 与 
我 们 平常 所 说 的 “信息 ”不 一 样 了 。 
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熟悉 通信 的 人 都 知道 克 劳 德 . 艾 尔 伍德 * 香农 (Claude Elwood Shannon) 。 
第 5 章 介 绍 过 香农 ,他 是 美国 数学 家 ,他 在 研究 密码 学 原理 时 ,提出 了 信息 
论 。 他 提出 :“ 对 于 信息 论 的 研究 而 言 ,信息 的 “意义 ?基本 上 无 关 .” 也 就 是 
说 ,我 们 要 剥 除 信息 的 语义 内 容 , 假 装 听 不 懂 信 息 说 的 是 什么 ,排除 人 心理 上 
对 信息 有 无 意义 的 判定 ,只 是 “机 械 地 ”关注 传 来 的 字符 .数字 等 。 例 如 “1 十 
1 一 2? 这 条 信息 与 “1 十 1 一 3” 这 条 信息 ,它们 的 信息 量 是 相同 的 。 那 么 ,去 除 
掉 了 这 些 我 们 人 类 所 关注 的 意义 ,信息 还 剩 下 什么 了 呢 ? 

香农 认为 ,还 剩 下 业 。 

炉 又 是 什么 ? 

炉 , 是 体现 混乱 程度 的 度量 ,也 是 热力 学 中 用 来 表示 物质 状态 的 参量 。 
举例 来 说 ,看 看 你 的 衣 橱 ,如 果 它 很 乱 , 你 可 以 说 你 的 衣 橱 “ 箭 很 大 ”; 如果 它 
很 整洁 ,分 类 清楚 ,一尘不染 ,你 可 以 说 你 的 衣 橱 “ 业 很 小 ”。 

“ 炉 " 是 从 何 而 来 呢 ? 

“ 粹 ”这 个 概念 并 不 是 由 香农 提出 来 的 。 早 在 1854 年 , 克 劳 修 斯 (T. 
Clausius) 就 提出 了 类 (Centropie) 的 概念 ,并 将 其 应 用 在 热力 学 中 。 我 国 物理 
学 家 胡 刚 复 于 1923 年 首次 把 英文 entropie 译 为 “ 焙 "。 将 “ 人 ” 字 拆 开 来 看 ， 
火 表示 热量 , 商 是 热能 除 以 温度 的 结果 。 语 言 的 魅力 在 于 清晰 且 生 动 的 表 
达 , 而 翻译 的 魅力 是 在 意义 和 风格 的 对 等 之 上 ,更 多 一 分 奇妙 的 融合 与 创造 。 

焙 是 描述 一 个 系统 的 无 序 程度 的 物理 量 。 灶 越 大 ,无 序 程度 越 高 ; 和 越 
小 ,无 序 程度 越 低 。 粹 的 概念 提出 ,是 为 了 更 好 地 解释 热力 学 第 二 定律 一 一 
不 可 道 热力 过 程 中 灶 的 微 增 量 总 是 大 于 零 , 又 称 * 灶 增 原理 ”, 它 表明 了 在 自 
然 过 程 中 ,一 个 孤立 系统 的 总 混乱 度 ( 即 “ 业 ”) 不 会 减 小 。 简 单 地 说 就 是 ,“ 孤 
立 系 统 ” 只 会 越 来 越 混乱 ,不 会 自己 变 整洁 。 

我 们 来 看 这 张 图 。 图 6. 3 的 左边 是 大 自然 中 自然 形成 的 沙 堆 ,没有 什么 
秩序 , 它 的 简 值 很 高 ;图 6. 3 的 右边 是 一 座 沙子 堆砌 的 城堡 ,有 规则 的 形状 ， 
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它 的 炉 值 很 低 。 


43 不 同形 态 的 沙子 的 炳 


一 切 自发 的 不 可 逆 过 程 都 是 从 有 序 到 无 序 的 变化 过 程 , 向 混乱 度 增 加 的 
方向 进行 ,于 是 有 了 上 面 提 到 的 “ 焙 增 原理 ?。 就 好 比 ,图 6. 3 右 图 中 的 城堡 
可 能 夫 塌 成 一 盘 散 沙 , 图 6. 3 左 图 中 的 沙子 却 不 会 自己 堆 成 城堡 ;理想 气体 
扩散 后 不 可 能 自己 缩 回去 ;在 不 整理 的 情况 下 ,你 的 房间 会 越 来 越 乱 。 要 注 
意 的 是 , 灶 增 的 条 件 是 这 个 体系 与 环境 没有 能 量 交 换 , 这 个 过 程 是 不 可 逆 过 
程 一 一 所 以 不 存在 “ 粹 减 ”。 但 在 生物 学 中 ,存在 一 个 “ 负 焙 ”的 概念 。1944 
FE 醉 定 详 出 版 了 《生命 是 什么 ) 一 书 , 在 该 书 中 提出 了 “ 负 炉 ”的 概念 一 一 生物 
会 吸收 环境 中 的 功 ,而 减少 自身 的 粹 ,因而 变 得 有 序 。 

人 类 总 是 善于 运用 思维 的 类 比 与 迁移 ,学 科 的 交叉 借鉴 形成 了 科学 研究 
的 良性 循环 。 除 了 生物 学 , 粹 还 被 广泛 应 用 于 控制 论 .概率 论 、 天 体 物理 等 领 
域 。 在 科学 研究 中 , 蚁 是 用 来 描述 、 表 征 系 统 不 确定 程度 的 函数 ;在 社会 科学 
中 , 炉 用 以 借 哈 入 类 社会 某 些 状态 的 程度 ;在 传播 学 中 , 炉 表示 一 种 情境 的 不 
确定 性 和 无 组 织 性 。 后 来 ,香农 将 焙 的 概念 引入 到 信息 论 中 来 ,用 来 描述 信 
息 的 不 确定 性 。 

人 们 常 说 信息 多 、 信 息 少 ,可 是 信息 究竟 有 多 少 呢 ? 信 息 粹 解决 了 信息 
的 量化 、 度 量 问 题 ,我 们 可 以 用 一 个 数字 来 说 明 这 条 信息 有 多 大 。 它 是 怎 
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做 到 的 呢 ? 

如 果 去 掉 此 信息 ,内 容 的 可 能 性 越 多 .不 确定 性 越 大 ,那么 此 信息 蕴含 的 
信息 量 就 越 大 。 这 里 的 不 确定 性 、 可 能 性 指 的 就 是 概率 。 例 如 ,在 汉语 中 ,如 
果 紧 跟 在 “ 什 ” 后 面 的 字 是 “ 么 ”, 那 么 这 其 中 的 信息 量 就 很 小 ,因为 * 什 ”后 面 
出 现 *“ 么 ”的 概率 很 大 ,不 需要 别人 来 告诉 你 ,你 也 能 猜 到 。 

香农 认为 ,信息 不 是 创造 出 来 的 ,而 是 选择 出 来 的 。 也 许 你 会 说 ,这 样 的 
选择 也 太 难 了 。 例 如 ,对 于 “算法 统治 世界 ”这 样 一 句 简单 的 话 ,每 个 字 都 是 
从 几 干 、 几 万 个 字 中 选取 出 来 的 ,这 样 如 何 计算 ? 首先 ,第 一 个 字 “ 算 ”是 从 众 
多 汉字 中 挑选 出 来 的 ,但 并 非 所 有 汉字 接 在 “ 算 ” 字 后 面 的 概率 都 是 相同 的 ， 
显然 “法 ” 字 的 概率 是 相对 较 高 的 ,以 此 类 推 “ 治 ” 接 在 “ 统 ” 后 面 ,“ 界 ” 接 在 
“ 世 ” 后 面 ,概率 都 是 比较 高 的 ,所 以 对 于 某 些 位 置 ,可 能 出 现 的 汉字 数目 是 比 
汉字 总 量 要 少 的 ;其 次 ,不 要 忘 了 ,在 信息 的 世界 里 ,计算 机 只 认得 二 进 制 数 
字 , 所 有 的 文字 符号、 语音 、 图 片 视频 等 都 要 转换 成 “0” 和 “1” 的 组 合 才 能 被 
计算 机 处 理 , 比 如 字母 a 在 计算 机 眼 里 是 01100001。 这 样 每 一 个 位 置 都 有 
“0” 和 “1” 两 种 可 能 性 ,计算 信息 的 不 确定 性 便 有 迹 可 循 了 。 

每 个 符号 传递 的 信息 量 与 可 能 符号 的 出 现 概率 有 关 。 香 农用 下 面 这 个 
式 子 告诉 我 们 怎么 算 信息 量 的 大 小 。 依 据 式 子 计 算得 到 的 信息 量 的 单位 是 
比特 ,因为 式 子 中 的 2 代表 的 是 二 进 制 。 

— 2 p: logzp' 

初学 “ 炉 ”时 ,我 们 会 用 某 种 具象 化 的 东西 来 帮助 自己 理解 “ 炉 ”; 等 我 们 
真正 和 弄 民 了”* 焙 ”, 我 们 又 不 得 不 把 这 些 乱 七 八 糟 的 东西 从 脑子 里 清除 出 去 。 
归 到 数据 的 价值 上 来 。 如 果 说 数据 的 价值 是 信息 ,那么 这 里 的 信息 又 
是 指 什么 呢 ? 在 数据 交易 的 场景 下 ,我们 考虑 的 是 对 交易 产生 价值 的 信息 。 
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在 此 ,我 们 提出 两 种 对 价值 雯 的 定义 。 

一 种 是 根据 数据 的 不 确定 性 来 定义 。 对 于 数据 的 各 个 字段 ,如 性 别 、 年 
龄 和 身高 ,如果 每 个 字段 的 取 值 可 能 性 多 , 则 其 粹 大 ,对 各 个 字段 的 炉 进 行 加 
权 , 最 终 获 得 的 总 炉 便 是 这 份 数 据 的 价值 和 今 了。 价值 炉 越 大 , 则 数据 的 价值 
越 大 。 

另 一 种 定义 是 利用 数据 各 个 字段 之 间 的 相关 性 。 数 据 各 个 字段 之 间 的 
相关 性 (包括 正 相 关 和 负 相 关 ) 强 , 且 相 关 关系 数目 多 ,数据 的 价值 粹 小 ,其 价 
值 更 高 。 

这 里 仅仅 对 价值 粹 进行 了 简要 的 介绍 ,价值 粹 的 定义 和 应 用 仍然 有 待 进 
一 步 的 深入 研究 。 


价格 多 少 谁 说 了 算 


什么 是 数据 ? 

123, 这 是 数 ;一 场 电 影 ,两 段 对 话 ,三 种 心情 ,这 也 是 数据 一 一 以 数 为 依 
据 , 描 述 一 个 实体 ,或 者 一 个 事件 。 

什么 是 交易 ? 

李 达 会 砍 柴 , 张 顺 能 打 鱼 。 李 连用 自己 砍 的 柴 换 张 顺 打 的 鱼 。 这 是 交 
易 一 一 后 来 这 样 做 的 人 多 了 , 柴 太 重 , 鱼 不 好 擒 , 于 是 用 一 样 东 西 代替 柴 和 鱼 
去 交换 , 那 就 是 钱 。 

对 大 部 分 人 来 说 ,一 条 鱼 能 项 半天 的 饱 ,相当 于 1 斤 柴 的 价格 , 值 10 块 
钱 ; 然 而 ,一 份 数据 等 价 于 多 少 斤 柴 , 值 多 少 钱 ,答案 对 每 个 人 来 说 都 是 大 相 
径 庭 的 。 

在 第 4 章 中 ,已 经 介绍 了 许多 传统 的 定价 方法 ,但 由 于 数据 商品 的 特殊 
性 ,传统 的 定价 方法 并 不 适用 于 数据 定价 。 我 们 需要 提出 新 的 数据 定价 算 
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法 。 我 们 将 把 数据 定价 分 为 两 个 过 程 : 数据 价值 评估 和 定价 策略 。 前 者 决 
定 了 某 份 数据 最 多 能 卖 多 少 钱 , 最 少 可 以 卖 多 少 钱 ;后 者 决定 了 用 什么 样 的 
策略 来 决定 当前 它 具 体 该 卖 多 少 钱 。 听 上 去 有 点 绕 , 其 实 就 是 商品 的 成 本 和 


卖方 确认 数据 的 价格 区 间 


首先 ,交易 者 要 确定 价格 区 间 ,也 就 是 某 个 数据 商品 的 最 低 价格 和 最 高 
价格 。 我 们 可 以 用 成 本 法 来 估计 数据 商品 的 最 低 价格 ,例如 ,根据 数据 提供 
商 付出 了 多 少 人 力 物 力 ,以 及 他 们 本 身 对 数据 的 基本 估 值 ,可 以 推算 出 数据 
的 最 低 价 格 。 也 许 你 会 问 , 确 定 最 低 商品 价格 就 好 了 ,为 什么 还 要 给 它 一 个 
上 限 呢 ?难道 有 钱 不 赚 ? 

事实 上 , 当 商 品 的 成 交 价 超出 了 估计 的 最 高 价格 ,很 可 能 影响 数据 交易 
市 场 的 稳定 性 ,也 不 排除 一 些 非常 .甚至 非法 的 市 场 运作 。 为 了 数据 市 场 能 
够 健康 的 发 展 ,最 高 价格 的 估计 是 有 必要 的 。 


买方 出 价 


确定 好 价格 区 间 后 ,就 要 进行 精确 定价 。 正 如 莫 里 克 所 说 ,事物 只 有 当 
人 们 认为 它们 有 价值 时 , 才 有 价值 。 对 于 不 同 的 需求 方 来 说 ,同一 份 数据 价 
值 很 可 能 相距 甚 远 ,所 以 如 果 不 考 虑 需求 方 , 直 接 制定 数据 的 价格 是 没有 意 
义 的 。 在 利用 基本 的 价值 定义 确定 数据 的 大 概 价格 区 间 后 ,最 重要 的 还 是 利 
用 定价 策略 来 对 每 一 份 数据 进行 精准 地 定价 。 

卖方 并 不 知道 每 个 需求 方 愿 意 出 多 少 钱 购 买 他 /她 要 出 售 的 数据 商品 ， 
最 好 的 方法 就 是 让 他 们 自己 说 出 来 。 

这 就 像 拍卖 一 样 ,也 是 我 们 认为 目前 最 适合 作为 数据 定价 策略 的 方式 ; 
让 需求 方 自己 出 价 。 
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说 起 拍卖 ,大 家 一 定 会 想到 影视 剧 中 的 商战 现场 。 拍 卖 者 拿 出 一 件 物 
品 , 多 位 衣冠 楚楚 的 竞拍 者 坐 在 下 面 ,有 的 势 在 必得 ,有 的 神情 紧张 ,有 的 露 
出 暗黑 式 的 笑容 ,有 的 用 眼神 与 对 方 先 来 了 个 刀光剑影 。 只 待 拍卖 者 先 说 出 
起 价 , 随 后 一 场 暗 潮 测 涌 的 竞拍 便 拉 开 了 大 幕 。 

其 实 ,拍卖 远 比 电视 剧 中 演 得 复杂 。 拍 卖 是 经 济 学 研究 的 一 个 重要 问 
题 。 经 济 学 界 普遍 认为 : 拍卖 是 一 个 集体 (拍卖 群体 ) 决 定价 格 及 其 分 配 的 

拍卖 有 三 个 基本 条 件 : 

首先 ,拍卖 必须 有 两 个 以 上 的 买主 (多 个 买主 才能 产生 竞争 ); 

其 次 ,拍卖 必须 有 不 断 变动 的 价格 : 拍卖 并 不 是 买卖 双方 简单 地 讨 价 还 
价 , 而 是 由 买主 以 卖主 当场 公布 的 起 始 价 为 基准 另行 报价 ,直到 没有 人 再 加 
价 为 止 ; 

最 后 ,拍卖 必须 有 公开 竞争 的 行为 : 拍卖 是 不 同 的 买主 在 公开 场合 竞相 
出 价 , 竞 争 同一 物品 。 如 果 所 有 买主 都 无 心 竞价 ,没有 了 竞争 ,拍卖 就 失去 了 
意义 。 

拍卖 的 方式 也 有 很 多 种 。 大 家 最 为 熟悉 的 便 是 上 述 影视 剧 里 最 经 典 的 
拍卖 , 它 的 学 名 叫做 英格兰 式 拍卖 ,也 叫 增 价 拍卖 。 顾 名 思 义 ,就 是 竞拍 者 根 
据 拍卖 者 给 出 的 起 价 开始 向 上 叫价 ,直至 拍卖 者 愿意 出 的 最 高 价 出 现 ,拍卖 

有 增 价 拍卖 ,就 有 降价 拍卖 。 降 价 拍卖 又 叫 荷兰 式 拍卖 。 降 价 式 拍卖 通 
常 从 非常 高 的 价格 开始 ,价格 太 高 时 没有 人 竞价 ,这 时 ,价格 就 以 事先 确定 的 
数量 下 降 , 直 到 有 竞买 人 愿意 接受 为 止 。 降 价 式 拍卖 的 第 一 个 实际 的 竞价 常 
常 是 最 后 的 竞价 。 一 旦 有 人 竞价 ,就 成 交 。 虽 然 只 有 一 个 竞价 , 却 也 是 有 竞 
争 存在 ,能 反映 出 竞拍 者 的 预期 一 一 若 此 时 不 出 价 ,物品 就 会 被 别人 拍 走 。 
当然 ,降价 拍卖 更 多 地 应 用 在 拍卖 物品 的 品质 参差 不 齐 的 情况 下 。 第 一 个 出 
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价 最 高 的 竞买 人 可 以 买 走 全 部 物品 ,但 往往 只 买 走 这 些 物品 中 最 好 的 ,然后 
拍卖 继续 ,价格 下 降 , 当 另 有 竞买 人 愿意 接受 竞价 ,他 也 有 同样 的 选择 ,也 是 
买 走 余 下 中 最 好 的 ,然后 拍卖 又 继续 。 在 这 种 情况 下 ,虽然 竞买 人 大 部 分 时 
间 都 沉默 不 语 , 但 是 在 竞买 者 之 间 确 实 存在 持续 的 竞争 。 
还 有 一 种 影视 剧 中 的 常常 出 现 的 拍卖 方式 , 叫 密封 递 价 式 拍卖 ,又 称 招 

标 式 拍卖 。 这 种 拍卖 经 常 出 现在 土地 使 用 权 、 较 大 的 库存 物资 的 竞争 中 。 由 
竞拍 者 在 规定 的 时 间 内 将 密封 的 报价 单 ( 也 称 标书 ) 递 交 拍卖 人 ,然后 拍卖 人 
选择 竞拍 者 。 这 种 拍卖 方式 与 上 述 两 种 方式 相 比 较 , 有 两 个 特点 : 一 是 除 价 
格 条 件 外 ,还 可 能 有 其 他 交易 条 件 需 要 考虑 ;二 是 可 以 采取 公开 开标 方式 ,也 
可 以 采取 不 公开 开标 方式 。 

但 是 ,普通 的 拍卖 并 不 能 够 满足 数据 交易 的 特性 。 就 如 之 前 提 到 的 , 数 
据 作为 商品 ,是 可 以 复制 的 ,也 就 是 说 ,这 场 拍卖 的 得 标 者 可 以 不 止 一 个 人 ， 
而 对 于 需求 方 来 说 ,获得 这 份 数 据 的 人 多 了 ,也 有 可 能 对 自己 产生 影响 ; 同 
时 ,数据 又 是 可 以 重复 拍卖 的 有 时 效 性 的 , 随 着 时 间 的 流逝 ,数据 的 价值 是 
会 发 生变 化 的 。 所 以 参与 竞争 的 需求 方 需要 向 交易 平台 提供 的 信息 除了 出 
价 以 外 ,还 应 该 提供 自己 能 够 接受 最 多 与 几 位 竞标 者 共同 得 标 ,以 及 距离 下 
次 拍卖 同类 数据 至 少 间隔 多 长 时 间 。 对 于 数据 平台 来 说 ,如 果 多 人 得 标 ,如 
何 对 每 一 位 得 标 者 收取 费用 也 是 个 棘手 的 问题 。 

数据 定价 是 一 个 新 间 题 ,看 上 去 我 们 之 前 没有 遇 到 过 ,但 这 并 不 代表 我 
们 对 其 束手无策 。 下 面 我 们 借助 几 块 “他 山 之 石 ”, 希 望 能 找到 解决 数据 定价 
问题 的 新 思路 。 


从 没有 拍卖 锤 的 拍卖 到 数据 的 拍卖 


我 们 印象 中 的 传统 拍卖 场 总 是 惊 心 动 岗 , 暗 潮 泣 涌 。1766 年 ,一 位 来 自 
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澳大利亚 帕 斯 的 苏格兰 人 在 伦敦 开设 了 世界 上 第 一 家 艺术 品 拍卖 行 ,他 的 名 
字 叫 詹 姆 士 : 佳 士 得 (James Christie) ,于 是 拍卖 行 的 名 称 就 叫 “ 佳 士 得 拍卖 
行 ”( 最 早 也 翻译 成 克里斯蒂 拍卖 行 )。 图 6.4 是 佳 士 得 拍卖 行 的 拍卖 场景 。 


CLIIPS 


sa 


AAA 


图 64 传统 拍卖 会 
实际 上 ,有 许多 拍卖 并 没有 拍卖 锤 ,也 没有 拍卖 师 , 没 有 举 牌 ,甚至 没有 拍 
卖场 ,有 的 只 是 一 台 计 算 机 和 一 段 程序 ,整个 拍卖 周期 不 过 几 秒 钟 。 在 赛 博 经 
济世 界 中 ,拍卖 是 一 种 算法 ,是 由 计算 机 执行 的 ,一 种 程序 化 的 交易 方式 。 这 种 
算法 的 正确 性 体现 在 它 是 否 符合 拍卖 规则 , 它 的 效率 由 拍卖 完成 时 间 决 定 ,而 
它 的 性 能 则 由 拍卖 者 的 收益 决定 ,图 6. 5 给 出 了 拍卖 与 算法 的 映射 关系 。 


算法 拍卖 
(Em KK— (am) 
EQ— > 
Ce 一 >CE) 


图 65 拍卖 与 算法 的 映射 


我 们 用 两 种 典型 的 没有 拍卖 锤 的 拍卖 来 看 看 数据 交易 价格 是 如 何 确 
定 的 。 
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广告 拍卖 的 做 法 


通过 第 5 章 的 介绍 ,读者 已 经 对 搜索 算法 有 所 了 解 。 但 当 我 们 真正 用 搜 
索引 擎 进行 搜索 时 ,看 到 的 第 一 条 搜索 结果 往往 并 不 是 根据 前 面 介绍 的 搜索 
算法 算出 来 的 ,而 是 “广告 ”。 并 且 , 细 心 的 朋友 会 发 现 这 样 一 个 现象 ,即使 使 
用 同一 个 搜索 引擎 ,搜索 同样 的 内 容 ,出 现 的 广告 也 可 能 不 同 。 图 6. 6 是 笔 
者 10 分 钟 内 两 次 输入 “大 数据 ”, 某 搜索 引擎 显示 的 结果 : 在 第 一 次 搜索 中 ， 
某 在 职 大 数据 机 构成 功 拔 得 头筹 ,腾讯 大 数据 分 析 平 台 斩 获 亚军 ;在 第 二 次 
搜索 中 ,阿里 云 折 桂 ,而 腾讯 以 稳定 的 发 挥 保住 了 第 二 。 由 此 可 见 ,这 场 交 易 
并 不 像 传统 广告 那样 ,广告 主 给 了 地 铁 广 告 费 , 他 们 的 产品 就 会 按照 规定 的 
时 间 出 现在 地 铁 上 。 

这 是 一 场 实 时 交易 ,这 是 一 场 持久 战 , 这 是 一 场 博弈 。 

假设 某 网 站 有 一 个 广告 位 要 出 售 ,而 有 10 个 广告 主 看 上 了 它 。 怎 么 办 ? 
卖 给 甲 ? 乙 给 的 钱 多 ; 卖 给 乙 ? 两 的 点 击 率 高 ; 卖 给 两 ?本 和 两难 分 伯仲 …… 
如 果 能 雨露 均 沾 就 好 了 。 于 是 ,一 个 雨露 均 沾 的 办 法 一 一 实时 竞价 出 现 了 。 

广告 主 可 以 像 优 化 自己 的 推荐 系统 一 样 优化 广告 。 简 单 地 说 ,假如 你 最 
近 在 淘宝 中 搜索 过 连衣裙 , 当 你 再 次 打开 淘宝 的 时 候 , 它 会 向 你 推荐 各 种 各 
样 的 连衣裙 ,这 是 淘宝 内 部 的 推荐 ,这 里 用 的 算法 是 推荐 算法 ;然而 这 时 ,如 
果 你 打开 百度 浏览 新 闻 就 会 发 现 ,淘宝 的 连衣裙 店铺 们 出 现在 了 搜索 结果 的 
第 一 位 上 ,那么 这 一 次 就 是 广告 了 。 若 此 时 ,你 通过 百度 搜索 的 结果 点 进 了 
淘宝 网 ,那么 淘宝 就 会 为 你 的 这 次 点 击 给 百度 付费 。 淘 宝 的 这 次 出 现 ,背后 
是 一 个 广告 系统 的 运作 ,而 决定 它 冲 破 因 栏 出 现在 你 面前 的 正 是 竞价 广告 计 
价 算法 。 

其 实 , 对 这 次 展示 虎视 晃 须 的 商家 可 不 只 淘宝 ,还 有 了 唯 品 会 .京东 、 当 当 
等 电 商 平台 。 这 些 商 家 都 在 广告 平台 上 注册 并 填写 了 如 图 6. 7 这 样 的 表格 ， 
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DATA Er 
ne 


66 搜索 广告 示例 


说 明 自 己 的 目标 用 户 和 出 价 。 


每 隔 一 段 时 间 ,广告 商家 会 进行 一 次 投标 竞价 。 当 然 ,这 并 不 是 


派 了 几 个 员工 去 点 鼠标 . 敲 键 盘 竞 价 ,而 是 已 经 得 知 了 广告 主 需 求 的 


台 自 动 运行 程序 ,对 每 个 空闲 的 广告 位 进行 拍卖 。 


没 错 ,互联 网 广告 的 竞价 方式 就 是 拍卖 。 
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目标 HP 性别 ee 
了 ea 
Wt Sw vw 会， 姥 低 广告 后 本 
dt 
BrP a 
9 
SA © EX | 
投 议 二 | 中 ls 
Pra 
A © ES 
NF 
BMPS 5 风 信 入 ,不 红 为 
nM OR 
9 风 记 :op 上 
BNP3D EE 
WM 0 RX 
RR 
EP» 
To 站 雪 委 凌 读 应 8 讽 户 导读 人 NN 户 
内 
Crm 


67 互联 网 广告 投放 的 定向 条 件 


那么 ,在 计算 广告 系统 中 ,拍卖 方式 又 是 怎样 的 ,媒体 网 站 该 向 赢得 广告 
位 的 广告 主 们 收 多 少 费 用 呢 ? 最 简单 的 方法 就 是 按照 它 之 前 的 出 价 进行 收 
费 。 开 始 的 时 候 ,谷歌 和 雅虎 都 是 这 么 做 的 。 我 们 称 这 种 拍卖 方式 为 GFP 
(Generalized First-Price, 广 义 一 阶 价 格 拍卖 ), 如 图 6. 8 所 示 , 在 该 图 中 , 广 
告 主 A 的 出 价 最 高 ,因此 获得 广告 位 1 的 使 用 权 , 广 告 主 B 的 出 价 第 二 高 ， 
因此 获得 广告 位 2 的 使 用 权 , 广 告 主 C 出 价 最 低 ,所 以 拿 不 到 广告 位 ,广告 位 


1 每 小 时 发 生 


100 次 点 击 , 广 告 主 A 会 为 此 支付 100 元 ,同样 ,广告 主 B 会 为 


广告 位 2 支付 25 元 。 


但 是 ,他 1 


门 很 快 发 现 了 问题 一 一 这 种 做 法 很 可 能 导致 系统 不 稳定 。 具 体 


地 说 ,就 是 提 4 
时 ,广告 主 A 


广告 位 的 网 站 收益 不 稳定 ,竞价 过 程 效率 低 。 例 如 ,拍卖 开始 
出 价 0.1 元 , 见 状 ,广告 主 B 会 出 价 0.2 元 ,广告 主 C 退出 竞 


争 。 接 着 ,广告 主 A 出 价 0.3 元 ,广告 主 B 出价 0.4 元 …… 我 们 看 到 ,价格 会 
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oo 


和 
BB 于 一 广告 主 A 1 元 /点 击 


广告 位 1 
100 次 点 击 /小 时 训 
05225GD 


广告 主 B 0.5 元 /点 击 


广告 位 2 
50 次 点 击 / 小 时 


广告 主 C 0.1 元 /点 击 


sO 


图 68 广义 一 阶 价格 拍卖 示例 


以 一 个 非常 小 的 差距 “稳步 上 升 ”, 直 到 广告 主 A 出 价 0. 5 元 的 那 一 刻 ,广告 


主 B 决 定 离开 。 因 为 广告 主 B 认为 这 个 广告 位 的 每 次 点 


和 只 值 0. 5 元 ,也 就 


是 只 能 给 他 带 来 至 多 0. 5 元 的 收益 ,所 以 当 价格 超过 0. 5 元 时 他 退出 了 竞 
和 争 。 而 在 下 一 次 竞拍 这 一 广告 位 的 时 候 ,A 想 ,我 都 没有 竞争 者 了 ,我 还 出 那 
么 高 价格 干吗 ? 于 是 A 降低 了 出 价 。 而 B 得 知 这 个 消息 后 ,又 回来 加 入 到 
竞拍 中 ,于 是 微小 差 值 的 螺旋 竞争 再 次 上 演 。 然 而 ,这 种 价格 的 反复 波动 显 
然 不 是 市 场 想 见 到 的 。 大 家 都 希望 有 一 个 机 制 能 够 使 市 场 稳定 下 来 。 所 请 
稳定 ,是 指 整个 系统 处 于 均衡 状态 ,简单 地 说 ,就 是 对 于 最 终 赢得 这 若干 个 广 
告 位 的 每 一 条 广告 , 它 的 收益 都 比 排 在 其 他 位 置 上 高 。 每 个 广告 主 都 达到 了 
自己 希望 的 收益 最 大 状态 ,系统 自然 就 稳定 了 。 

2002 年 ,Google 提出 了 GSP (Generalized second-price ,广义 第 二 高 价 ) 


竞价 算法 。2007 自 


Economic Review 发 表 文 章 详细 分 析 了 GSP 算法 。 
直到 今天 ,在 真正 的 广告 竞价 系统 中 ,大 多 数 提供 广告 服务 的 媒体 网 站 


E, 哈佛 大 学 的 Benjamin Edelman 等 在 The American 
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依然 在 使 用 GSP 来 为 广告 位 定价 。 下 面 我 们 就 来 讲 讲 这 个 主流 竞价 算 
法 一 一 GSP。 

在 广告 位 拍卖 之 前 ,媒体 网 站 先 要 知道 广告 在 广告 位 上 的 点 击 率 。 点 刘 
率 表示 的 是 : 用 户 到 达 网 站 ,看 到 了 广告 ,有 多 大 概率 会 点 击 这 条 广告 。 从 
宏观 的 角度 ,点 击 率 又 可 以 等 价 于 在 所 有 进入 网 站 ,看 到 这 条 广告 的 人 中 ,有 
多 少 人 点 击 了 广告 。 显 然 ,在 广告 拍卖 的 整个 过 程 中 ,点 击 率 都 是 未 知 的 。 
所 以 ,我们 需要 预测 点 击 率 。 如 何 预 测 昵 ? 当然 不 是 拘 指 一 算 。 那 么 是 按照 
第 5 章 中 搜索 里 的 排序 算法 对 各 个 广告 位 进行 排序 吗 ? 也 不 行 。 搜 索 排序 
的 最 终 目 的 是 使 搜索 结果 的 排列 顺序 正确 ,而 广告 系统 需要 的 是 对 点 击 率 本 
身 的 预测 正确 。 为 什么 广告 系统 需要 知道 点 击 率 的 具体 数值 吧 ? 这 就 要 说 
到 拍卖 过 程 中 一 个 非常 重要 的 环节 一 一 对 候选 者 进行 排序 。 广 告 系统 对 各 
位 候选 广告 主 的 排序 ,不 单单 是 根据 广告 主 的 出 价 ,而 是 根据 eCPM 
(effective cost per mille) 进 行 排序 。 所 谓 eCPM, 是 指 千 次 展示 收益 的 估 值 。 
按照 用 户 点 击 广告 和 转化 成 购买 行为 这 两 个 发 生 在 不 同 阶段 的 行为 ,eCPM 
[以 分 解 成 点 击 率 和 点 击 价 值 ( 单 次 点 击 为 广告 产品 带 来 的 收益 ) 的 乘积 。 
对 于 媒体 网 站 来 说 , 它 可 以 通过 计算 eCPM 来 预 估 广 告 位 的 效果 如 何 。 所 以 
在 这 里 ,点 击 率 预测 不 是 一 个 排序 问题 ,而 被 看 成 一 个 回归 问题 。 

建立 点 击 率 预测 模 型 ,就 是 找 出 点 击 率 与 广告 .用 户 与 环境 之 间 的 关系 。 
虽然 只 用 三 个 词 “广告 ”用户 ” 和 “环境 ”就 概括 了 我 们 需要 的 特征 。 但 实际 
上 它们 对 应 的 具体 特征 数量 巨大 ,例如 ,广告 可 以 由 广告 主 ,广告 计划 ,广告 
组 ,广告 创意 等 多 层次 的 标签 组 成 ,用 户 和 环境 又 有 其 各 自 的 标签 ,而 它们 的 
组 合 数量 可 想 而 知 。 系 统 对 表现 这 些 特征 的 海量 数据 进行 在 线 的 机 器 学 习 
并 非 易 事 。 于 是 ,聪明 的 工程 师 想 出 了 一 些 方法 来 降低 组 合 数量 ,简化 运算 。 
在 建立 模型 之 后 ,会 用 迭代 的 方法 进行 优化 。 同 样 ,迭代 次 数 也 成 为 计算 机 
的 眼中 钉 ,因为 实在 太 多 了 。 于 是 ,工程 师 又 想 出 了 一 些 方法 来 减少 迭代 次 


ET 


| 
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数 。 当 然 , 这 些 方法 都 是 科学 合理 的 ,为 的 是 提高 计算 机 解决 问题 的 效率 。 

得 到 了 点 击 率 的 预测 值 后 ,拍卖 流程 正式 启动 。 为 了 便于 解释 GSP 这 
个 概念 ,在 这 里 ,我 们 假设 点 击 率 只 与 广告 位 有 关 。 在 下 一 节 中 ,我 们 会 讲 到 
在 真实 情况 中 由 谁 来 估计 点 击 率 ,根据 什么 估计 。 


言 归 正 传 ,GSP 到 底 是 


什么 意思 呢 ? 它 的 中 心思 想 就 是 ,对 于 赢得 每 个 


位 置 的 广告 主 , 都 按照 排 在 他 下 一 位 的 广告 出 价 来 收费 。 

我 们 看 图 6. 9, 假 设 已 经 预测 出 广告 位 1 每 小 时 有 100 次 的 点 击 , 广 告 位 
2 每 小 时 有 50 次 点 击 。 广 告 主 A 每 次 点 击 出 价 1 元 ,广告 主 B 每 次 点 击 出 
价 0.5 元 ,广告 主 C 出 价 0.1 元 。 三 人 开始 竞拍 ,广告 主 A 得 到 广告 位 1, 但 
他 只 需要 付 100X0. 5=50( 元 ) ,其 中 0.5 是 广告 主 B 的 出 价 。 同 样 地 ,广告 
主 B 得 到 广告 位 2, 他 最 终 付 的 钱 为 50X0.1=5( 元 ), 其 中 0.1 是 广告 主 C 
的 出 价 。 在 这 样 的 策略 中 ,对 于 每 个 广告 位 ,出 价 最 高 的 广告 主 ,只 需要 付 第 
二 名 的 出 价 。 我 们 可 以 这 样 理解 GSP, A 的 出 价 最 高 ,说 明 他 最 看 重 这 个 广 
告 位 ,所 以 我 们 把 广告 位 1 给 A, 同 时 我 们 非常 仁义 ,只 需要 A 出 B 的 报价 
即 可 。 这 样 A 就 以 比 自己 预算 低 的 价格 拿 到 了 广告 位 1。 


由 05D 
1 


国 一 广告 主 A 1 元 /点 击 


广告 位 1 


100 次 点 击 /小 时 


广告 位 2 


50 次 点 击 /小 时 入 


广告 主 C 0.1 元 /点 击 


3350 


广告 主 B 0.5 元 /点 击 


50X0 


图 69 广义 第 二 高 价 拍卖 示例 
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虽然 GSP 是 最 为 主流 的 定价 策略 ,但 它 并 不 是 广告 实时 竞价 的 最 佳 
策略 。 

GSP 存在 的 一 个 主要 问题 是 ,广告 主 按照 自己 对 广告 位 的 真实 估 值 报 
价 并 不 是 最 优 策略 。 大 家 可 以 设想 一 下 ,如 果 广告 主 的 最 优 策略 是 按照 自己 
的 真实 估 值 报价 ,事情 会 简单 很 多 ,广告 主 不 用 处 心 积 虑 地 考虑 如 何 报价 来 
获得 最 大 收益 了 ,直接 报 自己 的 真实 估 值 就 行 了 。 那 么 是 否 存 在 可 以 鼓励 广 
告 主 按照 真实 估 值 报价 的 机 制 呢 ? 

好 消息 是 这 样 的 理论 最 佳 策略 确实 存在 ,VCG(Vickrey-Clark-Groves) 
机 制 就 是 典型 的 代表 。 

VCG 的 核心 思想 是 : 对 于 赢得 广告 位 的 广告 主 , 其 所 付出 的 成 本 应 该 
等 于 他 占据 这 个 位 置 给 其 他 市 场 参与 者 带 来 的 价值 损害 。 简 单 地 说 ,他 需 
要 付 的 费用 ,就 是 其 他 人 的 损失 。 那 么 如 何 计算 其 他 人 的 损失 呢 ? 很 简 
单 ,把 他 去 掉 , 然 后 看 其 他 人 的 收益 增加 了 多 少 。 我 们 来 看 图 6. 10 所 示 的 


示例 。 


广告 位 1 
100 次 点 击 /小 时 


广告 主 B 0.5 元 /点 击 


广告 位 2 
50 次 点 击 /小 时 


广告 主 C 0.1 元 /点 击 


图 610 WB 拍卖 示例 


218 


第 6 章 你 的 数据 究竟 该 卖 多 少 钱 


告 主 A 每 次 点 击 出 价 1 元 ,广告 主 B 每 次 点 击 出 价 0.5 元 ,广告 主 C 
出 价 0. 1 元 。 现 在 只 有 两 个 广告 位 ,第 一 个 广告 位 平均 每 小 时 有 100 次 点 
击 , 第 二 个 有 50 次 点 击 。A 得 到 广告 位 1,B 得 到 广告 位 2。 在 广义 二 阶 价 
格 拍卖 中 ,A 要 付费 50 元 ,B 要 付费 5 元 。 如 果 使 用 VCG 方式 来 定价 ,必须 
考虑 如 果 A 没有 参与 拍卖 会 发 生 人 什么。 如果 A 没 参与 ,那么 B 会 得 到 广告 
位 1, 会 再 多 得 到 50 次 点 击 ,并且 B 认为 每 次 点 击 值 0.5 元 ,所 以 A 的 出 现 
意味 着 了 损失 了 25 元 ,此 时 ,C 会 得 到 50 次 点 击 ,C 认为 每 次 点 击 值 0. 1 
元 ,所 以 A 出 现 意味 着 C 损失 了 5 元。 根据 VCG,A 的 付费 应 该 是 给 B 和 C 
带 来 的 损失 之 和 , 即 25 十 5 二 30 元 。 然 后 ,考虑 如 果 也 没有 出 现 的 情况 ,此 
时 ,A 的 位 置 不 会 受到 影响 ,C 则 会 因此 每 小 时 失去 了 50 次 点 击 , 对 C 来 说 
损失 是 5 元 ,所 以 B 的 VCG 付费 应 该 是 5 元 。 
通俗 地 说 ,鼓励 广告 主 按照 真实 估 值 报价 就 是 鼓励 广告 主讲 真 话 ,为 什 
么 VCG 机 制 有 这 样 的 效果 呢 ? 详细 的 理论 证 明 我 们 不 过 多 介绍 了 ,大 家 只 
需要 记 住 一 点 ,这 里 的 关键 是 一 个 广告 主 该 付 多 少 钱 是 由 其 他 广告 主 的 出 价 
决定 的 ,在 这 种 情况 下 ,广告 主 最 佳 策略 就 是 讲 真 话 ,因为 说 假 话 也 不 会 带 来 
什么 好 处 。 
VCG( 拍 卖 机 制 ) 的 全 称 是 Vickrey、Clarke、Groves 三 个 人 名 字 的 缩写 。 
在 之 前 传统 拍卖 的 介绍 中 ,我 们 已 经 了 解 过 Vickrey 拍卖 。 不 难 猜 出 ,Clarke 
和 Groves 两 个 人 在 Vickrey 的 基础 上 研究 出 了 VCG 拍卖 机 制 。 然 而 ,在 闻 
名 的 VCG 中 ,只 有 Vickrey 获得 了 诺 贝 尔 经 济 学 奖 。 这 是 为 什么 呢 
回忆 前 面 介绍 的 Shapley, 我 想 聪明 的 你 已 经 有 了 答案 。 没 错 ,历史 总 是 
么 惊人 的 相似 。Vickrey 确实 是 VCG 之 一 , 获 诺 贝 尔 奖 的 也 是 他 。 但 使 
他 获得 诺 贝 尔 奖 的 , 却 不 是 VCG 这 一 成 果 , 而 是 他 在 信息 经 济 学 、 激 励 理 论 、 
博弈 论 等 方面 做 出 的 重大 贡献 。 
1935 年 ,Vickrey 获得 了 耶鲁 大 学 理学 学 士 学 位 。1937 年 获 哥 伦比 亚 大 


呢 
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学 硕士 学 位 。1945 年 起 ,Vickrey 开始 留 校 任 职 。1947 年 又 获 哥 伦比 亚 大 学 
哲学 博士 学 位 。 任 何 一 门 学 科学 到 极致 , 便 是 哲学 ,可 见 Vickrey 的 学 术 造 
谐 是 非常 之 高 的 。 而 后 ,他 开始 在 经 济 学 上 有 所 见长 ,这 一 发 展 起 来 , 便 一 步 
一 步 走向 了 诺 贝 尔 奖 。 这 期 间 , 他 又 在 1979 年 获得 了 芝加哥 大 学 的 人 文学 
博士 学 位 。 

看 过 他 的 教育 经 历 , 大 家 可 能 会 猜想 : 理学 出 身 、 一 直 在 学 校 里 没有 见 
过 外 面世 界 的 Vickrey 应 该 是 个 理论 经 济 学 家 吧 。 然 而 ,事实 总 是 超 乎 想象 
的 。Vickrey 是 一 位 典型 的 应 用 经 济 理论 家 ,他 的 研究 过 程 你 可 能 不 懂 , 但 他 
研究 的 东西 都 是 大 众 关 心 的 、 接 地 气 的 东西 。 

Vickrey 的 第 一 个 最 富 于 创造 性 的 成 果 , 是 他 对 税制 结构 方面 的 研究 。 
Vickrey 想 要 设计 一 种 最 优 的 税收 体系 , 尽 最 大 可 能 平衡 公平 与 效率 。 他 认 
为 如 果 只 考虑 公平 而 不 同时 考虑 调动 积极 性 , 收 税 人 员 就 会 从 富 人 那里 收取 
税金 ,将 其 中 一 部 分 再 分 配给 穷人 ,一 直到 将 富 人 的 税收 提高 到 他 们 认为 公 
平 的 水 平 ,最 后 使 人 们 的 税 后 收入 大 体 相等 。 显然, 这 种 “ 动 富 济贫 ”的 方法 
不 仅 不 能 激励 人 们 发 挥 自己 潜在 的 劳动 生产 能 力 ,反而 会 促使 人 们 隐瞒 他 们 
的 实际 能 力 。 因 为 具有 生产 力 高 的 工人 能 够 挣 得 更 多 的 收入 ,但 他 们 努力 获 
得 的 更 高 收入 会 被 更 高 的 税率 所 征收 。 所 以 ,在 这 样 一 个 纯粹 是 追求 公平 的 
税收 体系 下 ,最 具有 生产 效率 的 工人 将 不 会 十 分 卖力 地 工作 。 于 是 ,Vickrey 
提出 了 21 条 改革 美国 所 得 税 体 系 的 建议 。 他 发 明了 “累积 平均 制 ”” 遗 产权 
继承 税制 ”Vickrey 还 对 消费 税 、 公 司 税 、 政 府 债 券 的 税收 减免 .土地 价值 税 
等 方面 有 许多 研究 。 

20 世纪 60 年 代 ,Vickrey 开始 对 拍卖 等 具体 的 市 场 机 制 进行 研究 。 投 
标 或 喊 价 有 着 悠久 的 历史 。 传 统 观 点 认为 ,如 果 交 易 者 双方 所 掌握 的 信息 是 
不 对 称 的 ,那么 市 场 上 产生 的 均衡 结果 将 是 一 种 无 效率 的 状态 。Vickrey 却 
证 明 并 非 必 定 如 此 。 拍 卖 市 场 是 否 有 效率 ,取决 于 拍卖 规则 是 否 能 够 保证 没 
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有 人 可 以 通过 损害 集体 利益 去 实现 自己 利益 的 最 大 化 ,能 不 能 有 效 地 诱导 参 
与 者 主动 说 出 他 们 真正 愿意 支付 的 价格 。 首 先 , Vickrey 对 已 有 的 标准 的 拍 
卖 进行 了 分 类 ,形成 了 一 套 完 整 的 拍卖 与 投标 理论 。 然 后 ,他 开始 了 更 深入 
的 研究 。Vickrey 首次 研究 了 密封 投标 拍卖 问题 ,并 且 对 市 场 激励 机 制 与 信 
息 之 间 的 关系 进行 了 开拓 性 的 探索 。 他 强调 市 场 规则 的 制定 必然 要 受到 激 
励 一 致 性 的 约束 ,其 中 市 场 激励 是 从 交易 者 的 私人 信息 和 交易 者 参加 或 不 参 
加 交易 的 选择 自由 中 诱导 出 来 的 。 

Vickrey 对 于 投标 的 研究 ,其 重要 性 不 只 局 限于 投标 方面 。 因 为 投标 方 
法 解决 的 是 ,如 何在 信息 不 完整 或 其 分 配 不 对 称 的 情况 下 ,最 有 效 地 配置 资 
源 的 问题 ,这 开创 了 信息 经 济 学 研究 的 先河 。Vickrey 对 投标 与 喊 价 的 研究 ， 
带动 了 许多 相关 的 研究 ,诸如 保险 市 场 、 信 用 市 场 .工资 结构 等 问题 。 

金子 总 会 发 光 , 为 人 们 做 了 这 么 多 实事 的 Vickrey, 终 于 获得 了 属于 他 的 
荣誉 。 只 是 这 个 荣誉 来 的 时 间 , 有 点 晚 。 

1996 年 10 月 8 日 ,瑞典 皇家 科学 院 决 定 把 该 年 度 的 诺 贝尔 经 济 学 奖 授 
予 英 国 剑桥 大 学 的 Mirrlees 与 美国 哥伦比亚 大 学 的 Vickrey。 

在 得 奖 三 天 之 后 ,还 未 来 得 及 参加 颁奖 典礼 ,Vickrey 去 世 了 。 有 人 说 ， 
诺 贝 尔 的 光环 为 其 人 生 画 上 了 一 个 完美 的 句号 。 


数字 商品 是 怎么 卖 的 


电子 书 `、 飞 机 上 的 电影 .手机 上 的 App 等 商品 有 一 个 共同 的 名 字 , 叫 做 
数字 商品 。 数 字 商 品 和 数据 商品 有 着 许多 相似 的 地 方 。 它 们 都 没有 实体 ,都 
可 以 接近 零 的 边际 成 本 进行 复制 ,还 都 可 以 快速 “运输 ”到 顾客 手中 。 数 字 商 
品 的 定价 对 数据 定价 是 有 启发 的 。 在 电 商 网 站 上 ,我 们 能 看 到 许多 数字 商品 
的 买卖 ,它们 大 多 是 明码 标价 。 

可 是 ,虽然 数字 商品 可 以 几乎 不 需要 成 本 地 复制 无 限 份 ,但 制定 一 个 最 
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优 的 价格 是 个 很 大 的 难题 。 商 家 算 不 准 有 多 少 人 想 买 ,也 很 难 估计 他 们 愿意 
付 多 少 钱 。 而 且 有 时 候 , 商 家 并 不 想 无 期 限 .无 限制 地 供应 一 本 电子 书 或 飞 
机 上 播放 的 电影 。 

如 今 ,数字 商品 的 购买 ,支付 ,物流 都 可 以 在 线 上 “瞬间 ?完成 ,那么 如 果 
定价 也 可 以 在 线 上 互动 式 地 “瞬间 ”完成 , 岂 不 省 去 了 “人 砍 价 ”“ 犹 珠 ”“ 价 比 
三 家 ”的 过 程 , 大 大 提高 了 买卖 的 效率 ? 

线 上 拍卖 刚好 可 以 解决 这 个 问题 ,但 数字 商品 的 线 上 拍卖 和 广告 位 的 线 
上 拍卖 有 所 不 同 。 在 广告 位 的 线 上 拍卖 中 ,一 个 广告 位 只 能 投放 一 则 广告 ， 
有 一 个 中 标 者 ;在 数字 商品 的 线 上 拍卖 中 ,一 份 商品 的 中 标 者 不 止 一 个 ,成 交 
价 也 不 止 一 个 。 那 么 问题 来 了 : 在 一 次 拍卖 中 ,同一 种 商品 卖 出 多 少 份 最 合 
适 ? 对 每 位 中 标 者 收 多 少 钱 才 能 获得 最 大 利润 ? 怎样 才能 引导 竞标 者 说 出 
自己 愿意 支付 的 最 高 价格 呢 ? 

要 寻求 以 上 问题 的 最 佳 答案 ,拍卖 算法 的 设计 尤为 重要 。 每 位 竞标 者 都 
有 一 个 对 商品 的 心理 估 值 ,研究 拍卖 的 人 会 将 拍卖 者 利益 最 大 化 作为 目标 ， 
能 让 他 们 从 竞标 者 锦 里 掏 出 最 多 钱 的 方法 来 计算 拍卖 结果 。 算 法 不 怕 麻 
烦 , 不 怕 计 算 量 大 ,因为 计算 机 程序 可 以 解决 这 些 问题 ;但 是 ,如 果 算法 太 过 
烦琐 ,不 好 向 竞标 者 解释 ,万 一 解释 不 清 , 导 致 买 家 不 敢 轻易 下 手 , 就 得 不 偿 
失 了 。 所 以 拍卖 算法 的 设计 要 加 入 商业 性 的 因素 ,而 不 是 简单 的 最 优化 
问题 。 

不 同 的 拍卖 算法 有 不 同 的 性 质 , 下面 我 们 对 比 一 下 确定 拍卖 算法 和 随机 
拍卖 算法 。 确 定 拍卖 算法 ,就 是 在 计算 有 多 少 人 中 标 以 及 对 应 成 交 价 的 时 
候 ,每 个 步骤 所 用 的 方法 都 不 含 随机 性 ;而 在 随机 拍卖 算法 中 ,计算 拍卖 结果 
的 步骤 有 随机 的 过 程 。 设 想 这 样 一 个 场景 ,对 于 投入 拍卖 系统 的 每 一 个 标 ， 
我 们 用 其 他 的 标 计 算出 一 个 参考 价格 ,如 果 这 个 标 超 过 了 参考 价格 ,那么 它 
中 标 ,否则 竞标 失败 。 在 计算 参考 价格 的 过 程 中 ,我 们 可 以 列 出 一 个 公式 ,用 
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除 这 个 标 以 外 的 系统 内 所 有 其 他 的 标 来 计算 ,比如 取 其 他 所 有 标的 平均 值 ， 
这 就 是 确定 拍卖 。 如 果 我 们 先 在 其 余 所 有 标 中 随机 选 出 一 半 的 标 , 再 用 这 
半 的 标的 平均 值 作为 参考 价格 ,这 就 是 随机 拍卖 。 

也 许 读者 会 问 ,为 什么 在 计算 参考 价格 的 时 候 要 除去 这 个 标本 身 昵 ? 答 
案 是 ,为 了 让 竞标 者 说 真 话 。 理 论 推导 证 明 , 标 独立 的 拍卖 是 可 以 让 竞标 者 
“ 讲 真 话 ” 的 。 标 独立 的 意思 是 ,竞标 者 投递 的 标 只 决定 自己 是 否 中 标 ,不 决 
定 其 中 标 后 的 成 交 价 。 也 就 是 说 ,你 中 标 了 以 后 , 交 的 钱 数 是 由 其 他 竞标 者 
的 标 计算 出 来 的 ,并 且 它 不 会 超过 你 投递 的 标 。 

因为 拍卖 者 的 目的 不 同 ,所 面 对 的 买 家 也 不 同 , 所 以 要 因地制宜 地 设计 
拍卖 算法 ,才能 达到 目标 。 


数据 该 怎么 拍卖 


从 荷兰 拍卖 . 英 式 拍卖 ,到 广告 位 拍卖 ,数字 商品 拍卖 ,都 是 竞标 者 向 拍 
卖 者 报 出 自己 的 出 价 。 拍 卖 者 先 给 所 有 出 价 排 个 序 , 然 后 根据 事先 设 定好 的 
拍卖 规则 ,选择 一 个 或 者 多 个 出 价 高 的 人 中 标 , 最 后 宣布 结果 ,将 物品 交 给 中 
标的 人 。 也 就 是 说 ,在 传统 拍卖 中 ,出 价 高 的 一 定 会 中 标 。 

然而 ,出 了 高 价 的 中 标 者 真 的 愿意 与 别人 共享 一 份 数 据 吗 ? 在 他 们 的 心 
里 ,也 会 有 很 多 顾虑 与 犹 物 一 一 我 出 多 少 钱 才 能 中 标 ? 我 出 10 块 ,会 与 几 个 
人 共享 ,我 出 5 块 , 又 会 与 几 个 人 共享 呢 ? 对 于 企业 和 组 织 机 构 来 说 ,数据 的 
共享 情况 很 可 能 直接 影响 数据 为 它们 带 来 的 收益 。 

例如 ,有 一 份 视频 用 户 的 数据 ,如 果 独 家 卖 给 爱 奇 艺 ,那么 爱 奇 艺 会 获得 
1000 万 用 户 ; 如 果 独 家 卖 给 腾讯 视频 , 则 腾讯 视频 将 获得 1000 万 用 户 ;如 果 
同时 卖 给 爱 奇 艺 和 腾讯 视频 , 则 两 家 会 分 获 500 万 用 户 ;以 此 类 推 ,如 果 同 时 
卖 给 4 家 视频 网 站 , 则 每 家 获得 250 万 用 户 。 如 果 进 行 数 据 拍 卖 , 爱 奇 艺 最 
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多 能 接受 与 一 家 视频 网 站 共同 获得 视频 数据 ,腾讯 视频 最 多 能 接受 与 两 家 
共享 。 
假设 有 10 家 企业 共同 竞标 一 份 数据 ,根据 出 价 和 利润 计算 ,拍卖 者 让 爱 
奇 艺 ,腾讯 和 优酷 土豆 三 家 共同 中 标 了 ,此 时 爱 奇 艺 陷 入 了 进退 两 难 的 境地 。 
如 果 它 退出 ,就 会 影响 拍卖 中 的 所 有 参与 者 ,扰乱 秩序 ,而 如 果 爱 奇 艺 勉 为 其 
难 地 接受 了 三 家 共享 ,那么 它 的 收益 将 大 打折 扣 。 在 下 一 次 拍卖 中 , 爱 奇 艺 
很 可 能 说 出 一 个 较 之 前 低 很 多 的 价格 ,因为 它 不 知道 它 将 与 多 少 人 共享 这 份 
数据 。 
如 何 能 周到 地 考虑 各 方 利益 ,使 拍卖 结果 出 现 后 ,各 个 中 标 者 不 会 有 “ 退 
标 ” 的 冲动 呢 ? 
针对 这 个 问题 ,我们 提出 一 种 新 的 拍卖 算法 ,让 竞标 者 说 出 愿意 支付 的 
最 高 价格 的 同时 ,也 说 出 最 多 愿意 与 几 人 共享 一 份 数据 。 如 图 6. 11 所 示 ， 
甲乙 、 丙 、 丁 四 人 投标 ,如 果 选择 出 价 最 高 的 人 中 标 ,那么 甲 当之无愧 ,并 且 
按照 甲 的 要 求 , 只 能 他 自己 中 标 ,此 时 拍卖 者 可 以 获得 15 元 收益 ;按照 四 位 
竞标 者 对 中 标 人 数 的 要 求 ,我 们 发 现 可 以 选 两 个 人 共同 中 标 , 那 么 有 乙 丙 乙 
丁 或 两 丁 三 种 可 能 ,显然 ,在 这 三 种 组 合 中 ,能 让 拍卖 者 获 利 最 大 的 是 乙 丙 组 
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图 &11 分 布 式 分 配 拍卖 
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合 , 此 时 如 果 对 两 人 都 收取 8 块 钱 ,那么 拍卖 者 可 以 获得 16 元 ;而 出 价 最 低 
的 竞标 者 丁 无 论 在 任何 情况 下 都 没 办 法 中 标 。 这 时 候 ,拍卖 者 很 容易 计算 出 
哪 一 种 中 标 结果 能 够 获得 最 大 利润 。 

在 这 个 新 的 拍卖 里 ,竞标 者 需要 “ 喊 出 ”两 个 数字 一 一 出 价 和 最 多 能 接受 
与 多 少 人 一 起 分 享 数据 。 这 样 一 来 ,出 价 最 高 的 人 未 必 能 中 标 ,但 中 了 标的 
人 都 能 够 接受 与 其 他 中 标 者 共享 这 份 数 据 。 竞 标 者 对 拍卖 结果 有 所 约束 。 
拍卖 者 在 做 中 标 人 数 的 决策 时 ,也 可 以 少 一 些 不 确定 的 猜测 ,真正 做 到 最 大 
化 自己 的 收益 就 可 以 了 。 

当然 ,我 们 可 以 看 到 ,这 种 拍卖 模式 并 不 适合 在 会 场 里 以 举 牌 叫价 这 种 
方式 进行 ,虽然 每 个 竞标 者 只 是 多 “ 喊 ” 了 一 个 数字 ,但 带 来 的 运算 却 不 止 一 
步 。 在 下 一 节 我 们 会 给 出 一 种 在 线 的 数据 交易 场景 ,让 拍卖 以 算法 的 形式 高 
速 、 高 效 进行 。 

再 强调 一 下 ,数据 的 拍卖 有 两 个 核心 问题 需要 解决 ; 

。 把 数据 卖 给 谁 ? 

。 对 每 位 中 标 者 收 多 少 钱 ? 

对 于 我 们 提出 的 新 算法 ,要 解决 以 上 两 个 问题 ,首先 要 将 竞标 者 的 标 进 
行 一 个 预 处 理 一 一 按照 竞标 者 提交 的 最 多 共享 人 数 对 标 进行 分 类 。 每 个 标 
可 以 出 现在 不 同 的 类 里 。 例 如 ,图 6.12 所 示 有 5 个 竞标 者 ,每 个 竞标 者 下 方 
的 第 一 个 数字 是 他 的 出 价 , 第 二 个 数字 是 他 能 接受 的 最 多 中 标 者 (包括 他 自 
己 在 内 )。 我 们 按照 竞标 者 允许 的 中 标 人 数 将 竞标 者 分 成 5 类 ,注意 ,这 种 情 
况 下 没有 办 法 有 4 个 或 5 个 人 同时 中 标 ,因为 没有 4 个 或 5 个 竞标 者 同意 4 
个 或 5 个 人 共同 中 标 。 

分 类 过 后 ,我 们 对 每 一 行进 行 传统 拍卖 , 英 式 拍卖 .荷兰 拍卖 .GFP、GSP 
或 是 VCG, 最 后 综合 每 行 的 拍卖 结果 ,最 终 选 择 收益 最 大 的 一 行 ,作为 最 终 
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图 612 标的 预 处 理 分布 式 分 配 拍卖 ) 


假设 对 每 一 行 做 单价 拍卖 一 一 中 标 者 支付 同一 价格 。 当 1 人 中 标 时 , 拍 
卖 者 的 收益 为 9; 当 2 人 中 标 时 ,拍卖 者 的 收益 为 6X2 二 12; 当 3 人 中 标 时 ， 
拍卖 者 的 收益 为 3X3 二 9。 所 以 最 终 中 标 人 数 为 2 人 ,分 别 是 出 价 为 (8,2) 和 
(6,3) 的 竞标 者 ,他 们 均 需 支付 6 元 ,此 时 拍卖 者 的 收益 为 12 元 。 

假设 对 每 一 行 做 多 价 拍卖 一 一 每 个 中 标 者 支付 的 价格 不 尽 相同 ,这 里 我 
们 以 GSP 拍卖 为 例 。 当 1 人 中 标 时 ,拍卖 者 的 收益 为 8; 当 2 人 中 标 时 ,拍卖 
者 的 收益 为 6 十 5 一 11; 当 3 人 中 标 时 ,拍卖 者 的 收益 为 5 十 3 十 1 二 9( 这 里 没 
有 比 (3,5) 低 的 出 价 , 设 定 此 中 标 者 支付 1 元 )。 所 以 最 终 中 标 人 数 为 2 人 ， 
分 别 是 出 价 为 (8,2) 和 (6,3) 的 竞标 者 ,他 们 分 别 需 支付 6 元 和 5 元 ,此 时 拍 
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卖 者 的 收益 为 11 元。 

当然 ,以 上 只 是 两 个 简单 的 算法 。 在 真正 的 拍卖 中 ,有 多 种 多 样 的 算法 
供 我 们 选择 。 比 如 刚刚 我 们 求解 的 过 程 都 是 确定 的 ,其 实 还 可 以 在 整个 过 程 
中 添加 随机 的 元 素 一 一 在 预 处 理 之 前 ,对 标 进行 一 次 筛选 ,每 一 个 标 都 和 一 
个 参考 价格 比 对 ,如 果 标 价 大 于 参考 价格 就 留 下 ,否则 直接 宣布 其 失败 ;参考 
价格 的 计算 过 程 是 随机 的 ,对 于 每 一 个 标 ,都 先 随机 选取 除 此 标 以 外 的 一 定 
数量 的 标 ,用 它们 的 出 价 计算 出 一 个 参考 价格 ;这 样 的 拍卖 便 加 入 了 随机 的 
因素 。 实 验证 明 , 对 于 我 们 提出 的 这 种 新 的 拍卖 ,随机 拍卖 和 确定 拍卖 收益 
相差 不 多 ,并 且 都 较为 稳定 。 所 以 我 们 可 以 根据 真实 场景 中 拍卖 系统 的 复杂 
程度 和 投标 人 数 来 设 定 拍卖 算法 。 

数据 还 有 一 个 特性 , 它 并 不 是 一 次 性 售卖 商品 , 它 可 以 重复 多 次 售卖 ， 
甚至 是 持续 售卖 。 所 以 ,除了 上 述 考虑 外 ,每 隔 多 久 进行 一 次 数据 包 或 应 
用 编程 接口 的 拍卖 也 是 个 问题 。 如 果 以 数据 包 的 形式 拍卖 ,那么 数据 与 其 
他 数字 商品 的 差别 在 于 时 效 性 ,对 于 有 时 效 性 的 数据 , 随 着 时 间 的 推移 , 数 
据 会 贬值 ;如 若 以 应 用 编程 接口 的 形式 售卖 ,数据 又 不 同 于 其 他 数字 商品 ， 
此 时 ,每 次 拍卖 的 中 标 者 获得 了 访问 相同 数据 集 的 权限 ,但 由 于 数据 是 动 
态 产 生 的 ,各 个 得 标 者 通过 这 个 接口 获得 的 数据 是 不 同 的 。 需 求 方 首先 需 
要 在 竞标 前 预 估 需 要 接口 权限 的 时 间 , 并 将 此 估 值 作为 标的 一 部 分 提交 ， 
得 标 后 ,根据 使 用 情况 ,需求 方 可 决定 是 否 参 与 下 一 次 竞标 ,并 调整 标 中 各 
个 信息 (出 价 、 使 用 时 间 、 可 共享 人 数 ) 的 值 。 对 于 以 应 用 编程 接口 形式 售 
卖 的 数据 ,做 成 类 似 计 算 广 告 一 样 的 交易 系统 是 完全 可 以 实现 的 。 而 对 这 
个 系统 的 建立 ,最 重要 的 便 是 机 制 和 规则 的 设立 ,保证 系统 的 中 立 性 ,实现 
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从 “人 的 博弈 ?走向 “系统 的 运行 ” 


“我 不 害怕 计算 机 ,我 害怕 没有 计算 机 。” 
一 一 艾 萨 克 。 阿 西 莫 夫 ,作家 
人 脑 的 容量 没有 那么 大 ,没关系 , 交 给 计算 机 来 记 ; 人 脑 的 运算 速度 没有 
那么 快 ,没关系 , 交 给 计算 机 来 算 ; 人 不 想 ,也 不 能 24 小 时 无 休 的 做 一 件 事 ， 
没关系 ,计算 机 可 以 。 是 的 ,只 要 人 类 想 出 了 办 法 , 剩 下 的 工作 交 给 计算 机 就 
可 以 了 。 所 有 规则 确定 .逻辑 清楚 的 事情 都 可 以 变 成 算法 ,由 计算 机 替 你 执 
行 。 几 个 程序 员 连 夜 奋战 之 后 ,这 件 事 就 变 成 了 只 需要 按 个 开关 , 敲 几 下 键 
盘 就 可 以 完成 的 了 。 人 类 消耗 大 量 脑 细 胞 或 者 钢笔 水 的 博弈 ,就 变 成 系统 的 
自动 运行 了 。 一 个 真实 的 例子 就 是 互联 网 广告 。 广 告 是 数据 价值 商业 化 最 
典型 .最 成 熟 的 应 用 。 从 传统 的 口头 广告 到 如 今 的 互联 网 广告 ,数据 为 广告 
赋予 了 新 的 生命 。 广 告 已 经 不 再 是 从 前 的 广告 了 。 从 广告 的 演变 和 广告 系 
统 的 发 展 中 ,我 们 也 可 以 窥见 数据 交易 的 发 展 方向 。 


广告 不 再 是 从 前 那个 “广告 "了 


表面 看 上 去 ,互联 网 广告 只 不 过 是 把 广告 放 到 了 互联 网 上 ,与 传统 广告 
相 比 ,只 是 换 了 个 媒介 而 已 。 但 本 质 上 ,广告 却 已 经 不 是 从 前 那个 广告 了 。 
毕竟 网 页 那么 多 ,商家 那么 多 ,分 散在 全 世界 各 地 , 谁 也 没 空 随时 约 个 下 午 
茶 ,成 百 上 干 的 人 坐 在 一 起 聊 聊 广告 的 问题 :也 不 会 每 隔 几 分 钟 就 召集 商家 
开 个 拍卖 会 ,为 一 个 网 页 上 的 广告 位 大 费 周折 ,拍卖 会 还 没 结束 ,用 户 早 都 关 
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闭 网 页 了 。 广 告 竞价 算法 背后 ,是 一 整套 计算 广告 系统 。 

也 许 我 们 都 曾 遇 到 过 临街 叫卖 和 发 传单 , 它 相 比 于 电视 .报纸 广告 的 好 
处 在 于 ,发 广告 的 人 可 以 真实 地 看 见 用 户 的 样子 ,有 针对 性 地 发 。 但 是 ,这 也 
有 两 点 问题 。 一 是 有 许多 特征 无 法 根据 外 貌 判 断 出 来 的 ;二 是 即使 有 从 外 貌 
能 判断 出 来 的 特征 ,但 特征 也 不 等 同 于 需求 。 就 像 不 是 所 有 心 宽 体 胖 的 人 都 
想 或 都 需要 减肥 ,有 时 可 能 会 被 客户 视 为 骚扰 。 

那么 ,怎样 才能 知道 客户 的 真实 需求 ,并 将 需要 的 东西 呈现 在 他 们 面前 ， 
同时 又 不 给 客户 造成 尴 众 和 困扰 昵 ? 这 就 要 靠 计算 广告 了 。 如 果 客 户 最 近 
几 天 用 某 种 浏览 器 时 常 登录 某 种 商品 的 官网 ,并 且 曾 经 进入 支付 页 面 ,或 者 
通过 某 个 搜索 引擎 搜索 过 某 类 商品 的 关键 字 , 算 法 就 能 够 根据 这 些 数 据 判断 
出 客户 的 需求 。 这 时 ,搜狗 浏览 器 .百度 搜索 就 成 了 广告 主 投放 广告 的 最 佳 
地 点 。 除 此 之 外 ,我 们 还 可 以 通过 客户 经 常 使 用 的 软件 来 决定 广告 投放 
媒介 。 

当然 ,这 些 广告 不 会 简单 粗暴 地 直接 呈现 在 每 个 用 户 面 前 ,提供 广告 位 
的 平台 商 有 义务 帮助 广告 主 找到 准确 的 客户 ,并 且 只 向 他 们 推荐 这 些 广告 。 
广告 平台 需要 不 断 地 通过 收集 和 分 析 每 个 用 户 的 特点 和 行为 ,给 每 个 用 户 贴 
上 标签 ,以 便 广 告 主 决策 广告 投放 的 客户 群体 。 计 算 广告 算法 令 广 告 精 准 ， 
每 个 客户 都 可 以 看 到 自己 想 要 的 广告 ,同时 在 同一 个 广告 位 ,也 可 以 在 同一 
时 间 ,向 不 同 客 户 展示 不 同 的 广告 。 这 里 面 使 用 的 最 主要 的 技术 之 一 就 是 受 
众 定向 。 实 现 这 一 技术 最 主要 的 就 是 大 数据 的 支持 。 

上 面 提 到 ,计算 广告 的 数据 主要 来 自 广 告 主 和 媒体 网 站 。 媒 体 网 站 相当 
于 传统 广告 的 广告 牌 ,是 提供 广告 位 的 网 站 。 假 设 淘宝 网 想 在 百度 搜索 上 投 
放 广 告 。 作 为 媒体 网 站 的 百度 搜索 ,掌握 着 第 三 方 数据 ,对 于 百度 的 用 户 , 它 
精准 地 知道 他 们 此 刻 搜 索 了 什么 内 容 , 最 近 经 常 搜索 什么 内 容 , 从 而 推断 用 
户 的 需求 ;而 身 为 广告 主 的 淘宝 网 自己 有 第 一 手数 据 ,对 于 自己 的 用 户 , 淘 宝 
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知道 他 们 是 男 是 女 , 喜 欢 什么 样 的 风格 ,最 近 想 买 什么 。 如 果 只 利用 淘宝 的 
数据 ,那么 将 不 知道 在 什么 时 间 ,给 哪些 用 户 投放 广告 ;但 如 果 只 利用 百度 搜 
索 的 数据 ,有 些 特定 需求 又 没 办 法 满足 ,比如 淘宝 想 挽 回流 失 的 用 户 ,或 是 希 
望 百度 能 帮 它 找到 与 它 本 来 用 户 相 似 的 潜在 用 户 。 因 此 ,广告 主 的 数据 将 极 
大 地 帮助 定制 化 用 户 标签 的 加 工 , 使 广告 能 够 更 精准 地 进行 投放 ,并 且 更 加 
千 合 广告 主 的 需求 。 

有 了 媒体 网 站 和 广告 主 的 配合 ,实时 竞价 在 程序 化 交易 市 场 中 如 鱼 
得 水 。 

实时 竞价 需要 ADX 和 DSP 两 个 平台 的 支撑 。ADX(Ad exchange) 是 广 
告 交易 平台 ,负责 接收 竞拍 者 提交 的 信息 ,得 到 广告 候选 ,而 后 根据 算法 选 出 
中 标 者 。 整 个 拍卖 的 过 程 由 ADX 来 做 ,这 样 一 个 系统 就 省 了 拍卖 场地 、 省 了 
人 力 物 力 , 极 大 地 加 速 了 拍卖 流程 。 ADX 是 按照 CPM 收费 的 , 即 按 每 干 次 
广告 展示 收费 。DSP (Demand Side Platform) 是 需求 方 平台 。 在 实时 竞价 
中 ,需求 方 能 够 完全 地 表达 自己 的 投放 意愿 , 它 的 技术 和 算法 比 ADX 要 复 
杂 。DSP 先 从 广告 库 中 检索 想 要 参与 竞争 的 广告 ,然后 对 广告 进行 排序 、 定 
价 ,最 后 向 ADX 报 出 候选 广告 和 对 应 的 出 价 。DSP 按照 CPM 向 ADX 报 出 
广告 的 出 价 ,所 以 准确 地 预 估 出 CPM 对 出 价 来 说 是 非常 重要 的 。 整 个 拍卖 
过 程 中 对 CPM 的 估计 都 由 DSP 来 承担 。 但 是 DSP 不 能 盲目 地 将 CPM 的 
值 作 为 出 价 提交 给 ADX, 它 需要 根据 CPM 和 市 价 随 着 时 间 的 变化 来 决定 最 
终 的 出 价 。 此 外 ,DSP 结合 媒体 网 站 和 广告 主 的 用 户 标 签 做 受众 定向 ,同时 
也 会 帮助 拉拢 老 顾客 ,发掘 新 顾客 。 
图 6. 13 展现 了 实时 竞价 的 过 程 。 
用 户 进入 媒体 网 站 ,网 站 向 ADX 发 送 请 求 :“ 放 哪 条 广告 呀 ?”ADX 向 
各 个 DSP 发 送 数据 , 问 :“ 你 们 都 出 多 少 钱 ?”DSP 根据 传 过 来 的 数据 和 广告 
主 自己 的 数据 决定 要 不 要 参加 竞标 ,如 果 参 与 , 便 把 自己 的 出 价 发 给 ADX。 
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Ae ookie 映 射 


图 &13 实时 竞价 过 程 示 意图 


ADX 等 待 事先 规定 好 的 时 间 , 然 后 按照 GSP 拍卖 选 出 中 标 者 ,并 将 结果 返 

给 媒体 网 站 。 最 后 ,媒体 网 站 从 DSP 那里 拿 到 广告 ,在 自己 的 网 站 上 完成 
这 一 次 展示 。 

这 里 要 说 明 的 是 , 当 ADX 给 DSP 发 送 用 户 标签 数据 时 ,DSP 如 何 知道 
ADX 发 来 的 用 户 数据 是 对 应 自己 手 里 的 哪些 用 户 的 呢 ? 这 就 要 用 到 
Cookie。Cookie 是 某 些 网 站 为 了 辨别 用 户 身 份 . 进行 用 户 路 径 跟踪 而 储存 在 
用 户 本 地 终端 上 的 数据 。 也 就 是 说 ,每 当 用 户 访问 一 个 网 站 的 时 候 , 网 站 就 
会 给 他 设置 一 个 用 户 ID, 相 当 于 起 一 个 名 字 , 当 用 户 跳 转 到 网 站 中 其 他 网 页 
的 时 候 ,这 个 ID 就 可 以 用 来 跟踪 他 的 浏览 记录 。 当 然 啦 ,为 保护 用 户 隐私 并 
提高 安全 性 ,Cookie 通常 是 要 经 过 加 密 的 。 我 们 通过 一 个 例子 来 看 看 在 计 
算 广 告 中 Cookie 是 怎么 发 挥 作用 的 。 

假设 韩 梅 梅 的 计算 机 里 原本 没有 任何 Cookie 记录 。 她 访问 了 www. 
baidu. com 的 首页 。 百 度 首 先 会 确认 此 时 此 刻 这 个 广告 位 是 可 以 动态 分 配 
的 ,然后 ADX 会 进行 发 送 消息 给 各 个 DSP, 告 诉 他 们 可 以 来 竞争 广告 位 了 。 
经 过 一 系列 的 计算 和 后 杀 后 ,有 一 个 DSP 赢得 这 次 拍卖 ,并 将 自己 的 广告 
复 给 ADX。ADX 向 韩 梅 梅 展 示 此 DSP 的 广告 ,并 在 系统 中 设置 她 的 


-- 
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Cookie。 浏 览 器 调用 百度 的 Cookie 映射 服务 , 读 取 韩 梅 梅 计算 机 中 的 
Cookie, 并 将 加 密 后 的 用 户 ID 发 给 此 DSP 设置 的 Cookie 映射 URL。 这 个 
DSP 生成 Cookie, 并 将 此 Cookie 存储 在 其 映射 表 中 与 韩 梅 梅 的 用 户 ID 相对 
应 的 位 置 。 此 DSP 将 其 Cookie 放 到 韩 梅 梅 的 浏览 器 中 。 

一 个 星期 后 , 韩 梅 梅 再 次 访问 了 www. baidu. com。 现 在 , 韩 梅 梅 的 计算 
机 上 同时 存 有 DSP 和 ADX 的 Cookie, 我 们 来 看 看 它们 是 如 何 匹配 上 的 。 
韩 梅 梅 会 看 到 网 页 ,同时 ,网 页 代码 会 包含 向 百度 请 求 广告 的 调用 。 在 
广告 竞价 期 间 ,ADX 会 向 实时 出 价 合作 伙伴 DSP 发 出 调用 请 求 , 问 它 是 否 
要 出 价 投放 广告 。DSP 收 到 包含 展示 信息 和 用 户 ID 的 广告 调用 ,在 其 匹配 
表 中 查找 韩 梅 梅 的 用 户 ID, 以 找 出 一 周 前 创建 的 Cookie。 然 后 ,这 个 DSP 利 
用 与 其 Cookie 相关 的 信息 ,对 广告 位 进行 出 价 并 赢得 这 次 展示 机 会 。DSP 
根据 所 掌握 的 信息 向 韩 梅 梅 投放 与 其 兴趣 相符 的 广告 。 


广告 里 的 数据 交易 


计算 广告 系统 是 最 早 进行 数据 交易 的 平台 。 

我 们 来 看 图 6. 14,ADX 在 问 DSP 愿意 出 多 少 钱 买 广告 位 的 同时 ,也 会 
将 相应 的 数据 发 给 DSP ,使 得 DSP 在 对 广告 位 出 价 时 ,能够 结合 广告 主 自己 
的 数据 和 提供 广告 位 的 媒体 网 站 的 数据 ,更 精准 地 做 决策 。 理 论 上 ,只 有 最 
终 中 标的 广告 主 可 以 继续 使 用 这 份 数 据 。 然 而 ,实际 上 ,要 保证 其 他 广告 主 


在 线 数据 交易 系统 


我 们 已 经 多 次 提 及 ,数据 时 代 真 正 有 意思 的 事情 是 数据 变 得 在 线 了 。 
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数据 交易 平台 


414 广告 系统 中 的 数据 交易 示意 图 


虽然 数据 交易 平台 不 断 涌现 ,数据 交易 案例 也 逐渐 增多 ,但 是 目前 数据 
平台 的 交易 还 是 以 线 下 为 主 、 线 上 为 辅 。 显然 ,这 并 不 是 一 个 高 效 的 方法 。 
而 对 于 数据 拍卖 ,拍卖 者 和 竞标 者 坐 在 一 个 会 场 里 举 手 喊 价 这 种 做 法 也 有 种 
穿越 回 到 古代 的 感觉 。 受 到 计算 广告 系统 的 启发 ,我 们 尝试 让 数据 通过 程序 
化 的 系统 进行 交易 ,这 样 我 们 就 可 以 通过 建立 一 套 独 立 的 算法 ,专门 用 于 数 

大 数据 的 本 质 是 在 线 。 数 据 交 易 也 应 在 线 ,实现 程序 化 .自动 化 .规模 
化 ,这 样 才 能 使 数据 流通 更 加 快速 地 产生 价值 。 

目前 的 数据 形式 一 种 是 数据 包 , 一 种 是 应 用 编程 接口 。 对 于 以 数据 包 形 
式 出 售 的 数据 交易 ,交易 过 程 可 以 参照 图 6. 15。 数 据 供给 方 将 数据 出 售 请 
求 发 送 给 数据 交易 平台 ,说 :“ 我 有 数据 要 卖 .” 随 后 ,数据 交易 平台 将 供给 方 
提供 的 数据 规格 (规模 、 数 量 、 格 式 、 大 小 ) .数据 字段 等 基本 信息 和 数据 样 例 
发 送 给 需求 方 ,同时 询问 需求 方 是 否 购买 此 数据 ,出 价 多 少 。 需 求 方 根据 数 
据 基本 信息 和 样 例 决 定 是 否 参 与 竞争 ,返回 决定 ,如 果 参 与 竞价 , 则 同时 返 
出 价 。 数 据 交 易 平台 运行 拍卖 算法 ,选择 中 标 者 。 为 了 保证 数据 平台 的 中 立 
性 ,在 选 出 中 标 者 后 ,平台 将 拍卖 结果 返回 给 供给 方 ,然后 由 供给 方 直接 将 数 


到 
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竞标 信息 


© 转 数据 信息 及 样本 竞标 信息 证/ 
一 本 一 
LO “二 本 


数据 提供 商 数据 需求 方 
| 数据 交易 平台 


数据 包 


图 615 以 数据 包 交 易 的 数据 交易 系统 示意 图 


对 于 以 应 用 编程 接口 形式 出 售 的 数据 交易 (交易 过 程 可 以 参照 
图 6. 16) ,数据 供给 方 将 访问 数据 接口 的 权限 提供 给 需求 方 。 供 给 方 首 先 确 
是 以 时 间 为 单位 出 售 ,还 是 以 抓 取 次 数 为 单位 出 售 ,然后 发 送 请 求 给 交易 
平台 ,开启 拍卖 。 交 易 平台 依旧 处 于 中 立 立场 ,只 负责 接收 供给 方 的 要 求 和 
需求 方 的 出 价 ,运行 拍卖 算法 。 由 于 应 用 编程 接口 形式 的 数据 交易 频率 比较 
高 ,并 且 每 次 拍卖 需要 依靠 历史 交易 数据 , 故 可 以 设立 一 个 数据 服务 商 , 以 记 


脱 敏 数据 /API 挝 个 


竞标 信息 


1 数据 信息 及 样本 4 竞标 信息 一 ES 1 


方 
数据 提供 商 人 人 数据 需求 方 


脱 敏 数据 /API 


图 616 以 应 用 编程 接口 形式 交易 的 数据 交易 系统 
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录 历 史 交 易 , 综 合 需求 方 的 需求 ,对 数据 进行 出 价 。 此 外 ,数据 服务 商 还 可 以 
兼 管 数据 管理 业务 ,对 数据 进行 统计 分 析 和 资产 化 管理 ,提供 行业 解决 方案 。 
数据 服务 商 可 以 是 数据 需求 方 的 一 个 部 门 或 分 支 机 构 , 也 可 以 是 单独 的 承包 
其 数据 管理 业务 的 企业 。 


破解 数据 交易 的 不 可 能 三 角 


政府 的 当务之急 ,不 是 要 去 做 那些 人 们 已 经 在 做 的 事 , 无 论 结果 是 好 一 

点 还 是 坏 一 点 ;而 是 要 去 做 那些 迄今 为 止 还 根本 不 曾 为 人 们 付 诸 行动 的 
事情 。 

一 一 约翰 。 梅 纳 德 。 凯 思 斯 


当知 能 经 济 从 多 维 空间 的 科幻 电影 里 走 进 我 们 的 真实 生活 时 ,我 们 的 世 
界 仿佛 悄然 被 偷 换 了 ,又 好 像 只 是 莫名 被 延展 了 。 当 数据 在 智能 经 济 中 大 展 
魔法 时 , 当 人 工 智能 \ 云 计算 ,数据 挖掘 这 些 词 变 成 行内 行 外 人 都 津津 乐 道 的 
话题 时 ,我 们 发 现 , 一 个 真实 的 智能 经 济 已 经 在 我 们 的 生活 里 。 

数据 是 智能 经 济世 界 的 重要 支撑 。 数 据 像 是 智能 经 济世 界 中 的 土壤 ,里 
面 含 有 多 少 养分 , 若 不 经 提取 ,我 们 不 会 知道 。 对 于 不 同 的 植物 来 说 ,同一 块 
土壤 ,能 给 它们 的 养分 也 不 相同 。 而 养分 ,就 是 有 物理 意义 的 信息 。 它 不 好 
一 概 而 论 地 定量 ,但 数据 却 可 以 定量 。 

数据 不 能 被 垄断 ,所 有 的 数据 都 掌握 在 一 家 公司 手 上 ,并 不 是 一 件 利于 
经 济 系统 健康 运行 的 事情 。 数 据 交 易 让 数据 变 得 可 以 流动 ,提高 了 智能 经 济 
系统 的 效益 。 
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数据 交易 从 概念 的 提出 ,到 平台 初 见 其 成 ,受到 了 越 来 越 多 的 人 的 关注 。 
有 人 提出 了 数据 交易 中 的 “不 可 能 三 角 ”。 

“不 可 能 三 角 ” 一 词 来 源 于 经 济 学 ,用 来 说 明美 国 经 济 学 家 保罗 . 克 鲁 格 
曼 提 出 的 “三 元 悖 论 ” 原 则 。 当 然 ,也 有 人 说 是 蒙 代 尔 提出 来 的 。“ 不 可 能 三 
角 ”, 是 说 一 个 国家 不 可 能 同时 实现 货币 政策 独立 性 .汇率 稳定 以 及 资本 自由 
流动 三 大 金融 目标 ,而 只 能 同时 选择 其 中 的 两 个 。 也 许 你 听 过 某国 的 总 统 竞 
选 时 提 到 要 同时 实现 上 面 三 个 目标 ,事实 上 那 大 概 只 能 停留 在 总 统 候选 人 美 
好 的 政治 愿景 中 。“ 不 可 能 三 角 ” 也 反映 了 世事 万 物 背 后 对 立 又 统一 的 矛盾 
概念 ,为 了 得 到 必须 取舍 ,相生 相克 ,相辅相成 。 

数据 交易 也 是 一 样 。 咨 询 顾问 胡 嘉 琪 指出 ,在 数据 交易 中 也 存在 这 样 的 
三 角 : 严格 的 数据 使 用 授权 、 数 据 的 大 规模 流通 以 及 提升 数据 的 使 用 价值 。 

严格 的 数据 使 用 授权 明确 规定 了 数据 的 所 有 权 和 使 用 权 ,数据 交易 必须 
经 过 合法 授权 。 在 数据 交易 黑市 中 ,高 价值 的 数据 大 规模 流通 ,但 因 泄 露 
户 隐 私 造成 的 违法 犯罪 不 在 少数 。 明 晰 的 授权 使 得 用 户 隐私 保护 有 所 凭 依 ， 
也 为 数据 交易 提供 了 法 律 上 的 保障 。 数 据 的 大 规模 流通 提升 了 数据 价值 。 
但 是 ,要 做 到 同时 保障 数据 授权 和 数据 的 使 用 价值 , 则 会 大 大 增加 数据 交易 
的 成 本 ,从 而 对 数据 规模 的 发 展 有 所 束缚 。 而 在 一 些 实现 了 大 规模 流通 且 相 
对 严格 地 保障 了 数据 使 用 授权 的 情况 中 ,例如 政府 数据 开放 平台 ,数据 难以 
具备 广泛 的 使 用 价值 ,再 如 提供 公共 数据 查询 服务 的 应 用 编程 接口 集 市 ,其 
数据 往往 欠缺 附加 价值 。 

那么 ,数据 交易 中 的 “不 可 能 三 角 ? 是 无 解 的 吗 ? 笔者 认为 不 然 。 数 据 虽 
然 是 特殊 的 商品 ,但 也 具有 商品 的 一 般 属性 。 要 破解 上 述 “ 不 可 能 三 角 ”, 需 
要 从 建立 良好 的 数据 交易 生态 圈 入 手 。 

对 有 数据 处 理 ,分 析 能 力 的 提供 方 和 需求 方 来 说 ,数据 质量 是 有 所 保障 
的 ,数据 的 使 用 价值 和 附加 价值 也 能 够 被 深度 挖掘 ; 而 对 于 没有 这 些 能 力 的 
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提供 方 和 需求 方 来 说 ,数据 服务 商 和 数据 交易 平台 可 以 为 其 解决 数据 质量 判 
断 、 价 值 提取 和 数据 增值 等 问题 。 也 许 有 人 会 说 ,这 样 不 更 加 提高 了 数据 交 
易 成 本 ,抑制 了 数据 的 大 规模 流通 了 吗 ? 这 一 点 大 可 不 必 担 心 。 数 据 的 需求 
量 越 来 越 大 ,在 授权 明晰 的 数据 交易 市 场 中 ,合理 .有效 的 数据 定价 ,可 以 大 
大 降低 数据 交易 成 本 ,最 大 化 数据 的 价值 ,从 而 扩大 数据 交易 规模 。 例 如 我 
们 提出 的 在 线 数据 交易 系统 ,以 及 可 以 运行 在 系统 中 的 新 型 的 拍卖 算法 ,都 
将 大 大 地 提高 数据 交易 效率 ,降低 数据 交易 的 门槛 ,打造 良好 的 数据 交易 生 
态 圈 。 如 此 ,“ 不 可 能 三 角 ” 就 不 再 是 数据 交易 的 瓶 诺 了 。 

值得 关注 的 是 ,即使 明确 了 数据 使 用 权 , 市 场 仍然 要 建立 保护 机 制 来 防 
止 侵权 行为 。 那 么 ,如 何 用 技术 手段 保证 数据 的 安全 并 保护 用 户 的 隐私 呢 ? 
我 们 将 在 第 7 章 继续 讨论 。 
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1969 年 ,在 美国 加 州 大 学 洛杉矶 分 校 , 坐 在 接口 信息 处 理 机 (Interface 
Message Processor,IMP)@ 前 的 大 学 生 查 理 ， 克 莱 恩 CC. Kline) 怀 着 激动 不 
安 的 心情 ,在 键盘 上 敲 入 了 一 个 字母 L, 然 后 对 着 长 途 电 话 另 一 端 ,位 于 斯 坦 
福 研 究 院 的 终端 操作 员 喊 道 :“ 你 收 到 *L 了 吗 ?” 

“是 的 ,我 收 到 了 “L’”.” 操 作 员 兴奋 地 回答 。 

“你 收 到 0? 了 吗 ?? 

“是 的 ,我 收 到 了 “O”, 请 再 传 下 一 个 !” 

克 莱 恩 紧 接着 键入 了 第 三 个 字母 “<G”。 然 而 这 时 传输 系统 突然 崩溃 了 
(图 7.1 是 当时 的 工作 日 志 )。 虽 然 这 次 互联 网 的 通信 试验 仅仅 只 传送 了 两 
个 字母 “L” 和 “0O”, 它 的 意义 却 非常 重大 且 激 动人 心 , 因 为 这 就 是 我 们 今天 无 
时 无 刻 不 在 使 用 着 的 互联 网 的 最 初 起 点 。 


@ 1969 年 ,美国 BBN 公司 制造 了 第 一 台 接口 信息 处 理 机 (IMP) ,也 是 阿 帕 试验 网 的 第 
一 准 节 起 。 
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71 见证 首次 互联 网 连接 实验 的 工作 日 志 


最 早 创建 互联 网 是 为 了 实现 信息 交换 ,如 今 已 经 过 去 40 年 了 ,人 类 制造 
出 的 信息 量 已 经 要 用 ZB(1ZB= 二 1024TB) 计 算 , 这 比 全 世界 所 有 海滩 的 沙 粒 
数 还 多 。 大 数据 技术 的 发 展 , 让 这 些 高 速 流转 的 海量 数据 可 以 为 我 们 提供 所 
需 的 服务 ,我 们 的 日 常生 活 轨迹 也 越 来 越 详 细 地 被 数据 记录 和 计算 。 然 而 ， 
当 一 切 变 得 有 据 可 查 , 有 迹 可 循 ,可 供 推演 ,这 些 关 乎 你 的 生活 和 隐私 的 大 数 
据 ,会 不 会 也 令 你 感到 前 所 未 有 的 担忧 ? 


我 们 还 有 隐私 吗 


在 巴黎 , 阶 沿 上 有 年 杀 , 门 上 有 嘴巴 , 窗 上 有 了 眼睛 ;最 危险 的 英 过 于 在 大 
门口 讲话 。 彼 此 临 走 说 的 最 后 几 名 ,好比 信 上 的 附 笔 ,所 泄露 的 秘密 对 听 到 
的 人 跟 说 的 人 一 样 危险 。 

一 一 巴尔 扎 克 
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隐私 权 是 基本 人 权 


技术 的 进步 不 断 侵 占 人 们 的 隐私 ,而 在 保护 隐私 的 问题 上 ,人 们 一 刻 也 
没有 停止 过 斗争 。 

1890 年 12 月 ,路 易 斯 布 兰 代 斯 (Louis D，Brandeis) 与 他 的 法 律 合 伙 
人 塞 缪 尔 : 沃 伦 (Samuel D，Warren) 在 《哈佛 法 律 评论 》 上 发 表 了 《隐私 权 》 
一 文 (图 7.2)。 这 是 美国 历史 上 最 为 著名 的 法 学 论文 之 一 ,也 是 隐私 权 在 世 
界 上 首次 被 提出 。 截 至 2017 年 7 月 ,这 篇 论文 的 Google Scholar 引用 数量 
已 经 超过 9700 次 。 


HARVARD 
LAW _REVIEYW. 


DECEMaER 57 ga No 


THE RIGHT TO PRIVACY. 


图 72 路 易 斯 * 布 兰 代 斯 护 ), 塞 缪 尔 * 沃 伦 和 中) 和 他 们 发 表 的 鲍 私 权 》 


美国 著名 社会 工作 者 弗 洛 伦 斯 .凯利 曾经 说 过 :“ 在 林肯 之 后 ,再 没有 
人 比 路 易 斯 . 布 兰 代 斯 更 理解 人 民 大 众 了 。” 布 兰 代 斯 曾 是 美国 最 早 提供 无 
偿 公益 服务 的 律师 之 一 ,凭借 丰富 的 社会 科学 知识 和 对 现代 工商 业 运 作 和 规 
范 的 了 如 指 掌 ,他 极力 论证 过 最 长 工作 时 间 和 最 低 工资 的 合 宪 性 ,他 坚持 不 
懈 地 与 那个 时 代 的 托拉斯 ,垄断 和 其 他 强悍 的 商业 利益 既得 群体 做 斗争 ,被 
视 为 * 人 民 自 由 的 捍卫 者 ”。1916 年 ,美国 总 统 威尔逊 任命 他 为 美国 最 高 法 
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院 的 终身 大 法 官 ,他 也 成 为 美国 联邦 最 高 法 院 历 史上 第 一 位 犹太 裔 大 法 官 。 
布 兰 代 斯 的 父母 来 自 东 欧 ,早年 因为 奥地利 一 场 反 犹太 主义 运动 移民 美 
国 , 布 兰 代 斯 出 生 在 美国 肯塔基 州 的 路 易 斯 维尔 城 ,18 岁 时 ,他 进入 美国 哈 
佛 大 学 法 学 院 与 沃 伦 成 为 同学 。 他 们 共同 协助 创办 《哈佛 法 律 评论 ) 了 ( 见 
图 7.3),1877 年 毕业 后 ,他 们 合伙 开 了 一 家 律师 事务 所 。 


73 ”人 印 佛 法 律 评论 》 的 历年 藏 本 


当时 的 美国 ,黄色 新 闻 猩 狂 ,为 满足 一 般 人 对 上 流 社会 生活 的 好 奇 ,报纸 
大 量 刊 出 名 人 私生活 的 相关 消息 迎合 大 众 口 味 。 其 中 , 沃 伦 的 夫人 梅 布尔 ， 
贝尔 德 (Mabel Bayard) 就 是 被 关注 的 对 象 之 一 。 沃 伦 夫人 出 身 名 门 , 她 的 父 
亲 是 一 位 参议 员 , 她 时 常 在 家 里 举办 聚会 .派对 等 社交 娱乐 活动 。 波 士 顿 报 
纸 热 衷 于 对 沃 伦 家 里 派对 的 具体 细节 情况 进行 详细 报道 ,一 并 挫 杂 着 一 些 男 
女 之 事 的 描述 。 自 1882 至 1890 年 间 , 共 有 近 60 篇 关于 沃 伦 . 贝尔 德 家 族 
生活 的 私密 消息 被 披露 给 公众 ,特别 是 沃 伦 的 母亲 和 姐姐 时 隔 两 周 的 葬礼 也 
上 了 报纸 头条 。 为 此 , 沃 伦 异常 愤怒 : 他 的 家 人 受到 了 侵犯 ,他 的 家 族 隐私 
就 像 是 时 刻 暴露 在 长 焦 镜头 之 下 。 他 邀请 布 兰 代 斯 共同 撰写 并 发 表 了 《隐私 


@ 1887 年 ,哈佛 大 学 法 学 院 一 位 名 为 ] McKelvey 的 3 年 级 学 生发 起 了 《哈佛 法 律 评 
论 ) 一 一 美国 第 一 家 由 学 生 编辑 和 管理 的 法 学 刊物 ,作为 美国 法 学 最 高 研究 水 平 的 代表 ,美国 
法 官 常常 引用 该 刊 的 评论 文章 论证 判决 的 正当 性 。 
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权 ; 文 章 , 其 中 写 道 :“ 新 闻 报 刊 超出 了 礼 义 廉耻 可 以 容忍 的 限度 。 传 播 流言 
莫 语 不 再 是 闲散 无 聊 人 士 的 消 遗 ,而 成 为 一 种 行业 ,被 人 们 孜孜 不 倦 又 厚 颜 
无 耻 地 从 事 着 .” 文 章 主要 观点 0 有 : 

不 论 表 达 形 式 是 言语 ,符号 绘画、 雕塑 或 是 音乐 都 无 关 紧 要 。 这 一 权利 
的 存在 也 不 取决 于 思想 或 情感 的 性 质 与 价值 ,或 表达 手段 有 多 么 杰出 。 一 封 
寻常 信件 或 一 篇 日 记 记 录 , 与 最 有 价值 的 诗篇 或 散文 ;拙劣 的 拼凑 或 涂鸦 乱 
抹 与 名 著 杰 作 , 它 们 所 获得 的 保护 别 无 二 致 。 在 前 述 的 每 一 种 情况 之 下 ,个 
人 有 权 决 定 是 否 将 属于 自己 的 东西 公之于众 。 

如 果 说 这 些 判 决 阐明 了 思想 ,情绪 感情 上 的 一 般 性 隐私 权利 ,那么 ,无 
论 其 表达 方式 是 写作 、 举 止 交谈、 姿势 或 面部 表情 ,都 应 当 受 到 同样 的 保护 。 
隐私 权 , 是 更 为 一 般 的 个 人 受 保护 权 ( 即 人 格 权 ) 的 一 部 分 。 

保护 个 人 作品 以 及 其 他 智力 产品 .情感 产品 的 法 则 ,是 隐私 权 ; 法 律 无 须 
阐明 新 的 原则 就 可 以 将 保护 范围 拓展 至 仪表 、 言 语 、 行 为 以 及 和 家 庭 及 其 他 
领域 的 个 人 关系 。 

如 果 侵 犯 隐 私 权 构 成 法 定 的 侵权 行为 ,从 侵权 行为 本 身 所 致 的 精神 痛苦 
的 价值 被 确认 为 赔偿 的 原因 之 后 ,要 求 损 害 赔偿 的 基础 便 得 以 存在 。 

沃 伦 和 布 兰 代 斯 在 文中 论述 和 援引 了 许多 普通 法 的 判例 ,推导 出 隐私 权 
的 存在 ,他 们 认为 古老 的 普通 法 在 永恒 的 青春 中 不 断 成 长 , 随 着 历史 的 演进 ， 
政治 .社会 和 经 济 的 变化 促使 新 的 权利 “隐私 权 ? 产 生 并 最 终 成 型 于 现代 社 
会 。 文 明 的 前 行 带 来 了 日 渐 紧 张 和 复 杂 的 生活 状态 ,人 们 对 公共 场合 变 得 更 
加 敏感 和 有 界限 感 , 在 此 基础 上 ,拥有 一 个 自己 的 相对 独立 和 私密 的 空间 显 
得 越 来 越 重 要 。 但 是 ,新 近 的 发 明和 商业 手段 一 定 程度 上 为 侵犯 人 们 的 隐私 


@@ 这 些 观点 主要 参考 Samuel D. Warren & Louis D. Brandeis, The Right to Privacy, 
Harvard Law Review, Vol.4., No.5, Winter 1890。 
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提供 了 便利 的 工具 和 途径 ,隐私 被 侵犯 使 人 们 遭受 精神 上 的 痛苦 与 困扰 ,与 
以 往 纯 粹 身体 上 的 伤害 相 比 ,有 过 之 而 无 不 及 。 因 此 ,人 们 迫切 地 需要 进 一 
步 采取 措施 来 保障 个 人 “不 受 打扰 ”的 权利 。 

第 一 部 隐私 权 法 案 诞 生 后 ,作为 满足 社会 进步 和 维护 公民 利益 的 基本 权 
益 , 隐 私 权 保护 不 断 向 前 发 展 。1960 年 ,威廉 ' 普 雷 瑟 (William L. Prosser) 
开创 了 隐私 权 的 分 立 理论 ,美国 侵权 法 中 隐私 权 基 本 体系 建立 。1965 年 , 格 
和 鲁 斯 沃 德 (Griswold V.。Connecticut) 诉 康涅狄格 州 案 中 ,道格拉斯 大 法 官 
(Douglas) 对 法 院 提议 ,形成 了 宪法 层次 个 人 隐私 权 的 存在 ,正式 宣告 隐私 权 
是 受 美国 宪法 保护 的 一 项 基本 权利 。1974 年 美国 国会 制定 了 《联邦 隐私 权 
法 》,1986 年 通过 了 《联邦 电子 通信 隐私 法 》,2000 年 出 台 了 第 一 部 关于 网 络 
隐私 权 保 护 的 重要 法 律 《儿童 网 上 隐私 权 保 护法 》, 还 有 一 些 相 关 法 规 包括 
《联邦 记录 法 兴 人 金融 隐私 权 法 兴 视 频 隐私 法 兴 电 话 消费 者 保护 法 兴 驾 驶 员 隐 
私 保护 法 兴 电 信 法 ;等 ,希望 通过 采用 政策 引导 的 行业 自律 模式 保护 公民 网 
上 的 个 人 信息 隐私 权 。 

2013 年 12 月 18 日 ,联合 国 大 会 通过 了 一 项 “数字 时 代 隐 私 权 ”的 决议 。 
该 决议 强调 ,隐私 权 是 民主 社会 的 基础 之 一 ,非法 或 任意 监控 通信 以 及 收集 
个 人 数据 ,是 侵犯 隐私 权 和 言论 自由 权利 的 行为 ,背离 了 民主 社会 的 信念 。 
该 决议 还 要 求 各 国 建立 有 效 的 国内 监督 机 制 ,确保 涉及 通信 监控 和 截取 ,以 
及 对 个 人 数据 收集 的 透明 度 ,并 接受 问 责 。 

这 项 决议 虽然 没有 强制 效力 , 却 在 政治 和 道德 层面 体现 了 国际 社会 对 保 
护 网 络 和 电子 通信 使 用 者 隐私 权 的 态度 ,表达 了 对 越界 情报 行动 以 及 对 个 人 
数据 大 规模 搜集 的 批评 与 忧虑 。 

2016 年 4 月 14 日 ,在 法 国 的 斯 特 拉 斯 堡 ,欧洲 议会 正式 通过 了 商讨 四 
年 之 久 的 《一 般 数 据 保 护 条 例 》, 它 取代 了 1995 年 发 布 的 (欧洲 数据 保护 指 
令 》, 并 直接 适用 于 欧盟 各 成 员 国 ,意味 着 欧盟 对 个 人 信息 保护 及 其 监管 达到 
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了 前 所 未 有 的 高 度 。 

新 条 例 按 照 数据 的 分 布 来 认定 法 律 管 辖 范围 ,与 提供 服务 的 企业 所 在 国 
家 和 地 区 无 关 , 即 法 律 管 辖 范围 会 适应 数据 流动 的 特性 而 变化 。 同 时 ,新 条 
例 还 提出 了 “被 遗忘 权 ”, 明 确 了 数据 所 有 者 如 果 不 希 望 自 己 的 数据 由 互联 网 
企业 使 用 ,可 以 撤回 数据 的 使 用 权 , 并 要 求 完全 删除 相关 数据 。 

2014 年 10 月 10 日 ,我国 开 始 实施 最 高 法 院 4 关 于 审理 利用 信息 网 络 侵 
害 人 身 权 益 民事 纠纷 案件 适用 法 律 若干 问题 的 规定 》, 这 是 首次 以 法 律 的 形 
式 为 我 国 公 民 的 个 人 信息 划 定 了 “保护 圈 ”。2016 年 11 月 7 日 ,十 二 届 全 国 
人 大 常委 会 表决 通过 了 《中 华人 民 共 和 国 网 络 安全 法 》( 以 下 简称 (网络 安全 
法 ))。 对 于 个 人 隐私 信息 保护 《网 络 安全 法 ) 制 定 了 多 个 条 目 , 包 括 “ 网 络 运 
营 者 收集 .使 用 个 人 信息 ,应 当 遵循 合法 .正当 ,必要 的 原则 ,公开 收集 、 使 
规则 ,明示 收集 、 使 用 信息 的 目的 方式 和 范围 ,并 经 被 收集 者 同意 。 交 网 络 运 
营 者 不 得 收集 与 其 提供 的 服务 无 关 的 个 人 信息 ,不 得 违反 法 律 ,行政 法 规 的 
规定 和 双方 的 约定 收集 .使 用 个 人 信息 ,并 应 当 依照 法 律 . 行 政法 规 的 规定 和 
与 用 户 的 约定 ,处 理 其 保存 的 个 人 信息 .罗网 络 运营 者 不 得 泄露 . 自 改 .毁损 
其 收集 的 个 人 信息 ;未 经 被 收集 者 同意 ,不 得 向 他 人 提供 个 人 信息 。” 

在 全 球 范围 内 ,隐私 权 作为 一 项 基本 人 权 , 受 到 越 来 越 多 的 关注 和 保护 。 


IM 


当 你 的 一 切 都 可 能 被 泄露 


美国 对 隐私 的 关注 已 经 有 一 百 多 年 ,然而 , 它 作 为 最 早 提出 隐私 权 概念 
的 国家 , 却 也 是 臭名 昭著 的 ”棱镜 ”计划 诞生 的 地 方 。 那 些 沃 伦 和 布 兰 代 斯 时 
代 完 全 无 法 想象 的 科技 ,正在 为 获悉 个 人 最 为 私密 、 最 为 个 性 的 信息 提供 更 
多 可 能 性 ,现在 比 以 往 任何 时 候 都 要 独 狐 。 

2016 年 下 半年 ,希拉 里 作为 美国 历史 上 第 一 位 主流 政党 的 女性 总 统 候 
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选 人 ,与 特 朗 普 共 同 角逐 总 统 竞 选 。 参 选 初期 ,希拉 里 的 支持 率 一 路 领先 , 曾 
获得 13% 竞 选 优势 ,然而 正当 她 节 节 胜利 之 时 ,维基 解密 的 好 事 者 截获 并 分 
析 了 她 的 私人 邮件 ,这 些 通过 私人 邮箱 和 位 于 家 中 的 私人 服务 器 收发 的 3 万 
封 邮件 ,包括 了 许多 涉及 国家 机 密 的 绝密 邮件 ,虽然 美国 联邦 调查 局 FBI 最 
后 并 未 提出 指控 , 然而 维基 解密 的 创始 人 阿桑 奇 2 对 邮件 门 的 追查 并 没 
止 。 这 位 愤青 技术 宅 人 恢复 出 部 分 被 删除 的 “私人 邮件 ”, 同 时 将 用 技术 手段 
获取 的 其 他 7 位 民主 党 的 重要 官员 在 内 的 约 2 万 封 内 部 邮件 一 起 在 维基 解 
密 上 予以 公布 。 被 爆料 的 邮件 显示 : 希拉 里 曾 不 遗 余力 地 搞 垮 她 的 党 内 竞 
争 对 手 ,有 计划 地 、 有 系统 地 伪造 特 朗 普 的 负面 新 闻 ; 还 与 其 团队 私下 从 事 着 
明码 标价 陪 吃饭 和 买 官 卖 官 的 活动 ,如 图 7.4 和 图 7. 5 所 示 。 


EL Column Labels 
] 2013 2014 2015 2016 Grand Total 
$ 231203.00 $ 4950.00 $ 250.00 $ 236,403.00 
$ 645,203.00 .00 
$ 404,785.00 $ 257,604.44 $ 250.00 $ 250.00 $ 662,889.44 
$ 127,400.00 $ 87,400.00 $214,800.00 
$ 355,150.00 $ 4450.00 $ 359,600.00 
$ 673,651.00 $ 653,305.00 $ 439,005.00 $ 1,765,961.00 
$ 2,409,560.00 $ 3,521,839.20 $ 3,042,866.00 $ 1,486,050.00 $10,460,315.20 
$5,783,372.37 $12,417,148.00 $ 7,100,699.90 $ 767,600.00 $26,068,820.27 
$ 684,955.00 $ 910,743.00 $ 1,435,249.33 $ 3,030,947.33 
$ TR $ 2,214,848.60 $ 3,824,918.99 E 0 i 
$ 6,225.00 
$ 0 捕 $ 1161500 $ 75,850.00 $ 1,672,903.40 
$4,527,360.00 $ 5,695,117.78 3,150,197.18 $ 2,96" 330.75 $1 71 
a 本 0 $1 下 


图 74 民主 党 靠 饭 局 在 历年 获得 的 收入 


面 对 如 此 劲爆 的 消息 ,美国 却 没有 一 家 主流 媒体 进行 报道 ,美国 民众 看 
不 到 希拉 里 的 丑闻 ,就 连 一 向 表明 独善其身 的 谷歌 公司 也 明显 偏向 了 希拉 
里 ,例如 ,当时 在 谷歌 搜索 引擎 中 输入 “总 统 候选 人 ?竟然 都 不 会 出 现 特 朗 普 。 
更 加 离奇 的 是 ,美国 民主 党 的 一 名 数据 主管 人 员 康 拉 德 ， 里 奇 (Seth Conrad 


@ 阿桑 奇 ,16 岁 就 潜入 加 拿 大 电信 系统 的 天 才 黑 客 , 后 创立 维基 解密 网 站 。 
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Name Total Raised position Datestart 。 Date End 


1 Matthew Barzun 3,503,080 Ambassador UK / Ambassador Sweden 。 8/21/2009 Present 
2 Julius Genachowski 3,494,919 Chairman FCC S129/2009 11/4J2013 
3 Frank Sanchez 3,415,000 Under-secretary Commerce 3/29/2010 Nov-13 
4 Jeffrey Katzenberg 3,120,500 
5 Frank White 2.383.005 
6 Stanley Grinstein 2,592,000 
7 Chartie Rivkin 2,562.400 Ambassador France / Asst Sec State B32009 Present 
8 Kirk Wager 2,330,000 Ambassador Singapore 25/2013 。 Present 
9 Alan solomont 2,328,500 Ambassador Spain 12/24f2009 s/f1f2013 
10 Mark Gorenberg 2,043,075 
11 John Roos 2.030.150 Ambassador Japan 8/20/2009 8/12/2013 
12 Nicole Avant 2,008,550 Ambassador Bahamas 190/22/2009 3n7212011 


75 美国 各 种 明码 标价 的 官位 , 几 十 万 美元 可 以 到 美国 驻 中 国 或 俄罗斯 的 大 使 馆 任 职 


Rich) 在 华盛顿 自己 寅 所 附近 被 枪杀 ,当地 和 警方 称 这 是 一 起 持 枪 抢 动 杀人 案 
件 , 就 此 结案 …… 但 里 奇 的 随身 财物 钱包 、 手 机 并 没有 被 拿 走 。 

维基 解密 继续 公开 希拉 里 团队 的 内 部 资料 一 一 希拉 里 选票 造假 。 具 体 
操作 的 方法 就 是 拉 上 一 车 非法 移民 去 某 个 投票 站 点 免费 一 日 游 , 此 外 ,还 存 
在 大 量 的 死人 投票 ,例如 某 二 战 老兵 去 年 已 经 去 世 ,结果 还 进行 了 投票 。 据 
不 完全 统计 ,这 届 选 举 有 180 万 死人 票 ,还 有 280 万 人 在 不 同 州 的 重复 投票 。 

阿桑 奇 一 次 次 在 维基 解密 上 揭露 美国 选举 黑幕 ,有 一 天 他 连续 发 送 了 多 
条 带 有 错别字 却 没有 什么 实质 含义 的 短 句 ,随后 删除 了 这 些 短 句 ,遍布 全 球 
的 阿桑 奇 粉丝 们 刨 根 问 底 , 很 快 就 发 现 所 有 的 错别字 连 起 来 形成 了 一 句 求救 
短语 :“HELP HIM!”。 原 来 就 在 总 统 选举 进行 到 最 关键 阶段 时 , 重 装 武器 
的 “警察 ?包围 了 阿桑 奇 所 在 的 厄瓜多尔 驻 英国 大 使 馆 , 一 直 对 阿桑 奇 表示 支 
持 的 厄瓜多尔 政府 拘 断 了 阿桑 奇 的 网 线 , 阻 止 他 对 外 发 声 。 
阿桑 奇 的 粉丝 们 被 彻底 激怒 了 ,他 们 联合 起 来 用 自己 的 方式 进行 示 
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威 一 一 2016 年 10 月 22 日 ,在 黑客 的 攻击 下 ,全 美 有 近 半 数 网 站 直接 瘫痪 , 包 
括 Twitter、Facebook 等 ,图 7. 6 是 阿桑 奇 的 粉丝 在 示威 。 希 拉 里 的 竞选 经 
理 约翰 : 波 德 斯 塔 (John Podesta) 曾 因 点 开 了 一 封 类 似 Google 发 给 他 的 警 
告 邮件 ,而 将 邮箱 密码 泄露 给 了 攻击 者 ,此 时 波 德 斯 塔 的 邮件 也 在 维基 解密 
上 进行 了 新 一 轮 曝光 ,美国 人 民 这 时 发 现 : 美国 政府 一 直 声称 在 寻找 当今 世 
界 上 最 大 的 那 教 、 活 跃 在 伊拉克 和 叙利亚 的 恐怖 组 织 ISIS 的 幕后 资金 来 源 ， 
原来 ,希拉 里 很 早 就 知道 是 卡塔尔 和 沙特 阿拉 伯 政 府 一 直 在 秘密 资助 ISIS， 
不 仅 如 此 ,希拉 里 和 她 的 团队 还 直接 接受 了 卡塔尔 和 沙特 阿拉 伯 政 府 的 国外 
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图 76 阿桑 奇 粉丝 们 聚集 在 大 使 馆 门口 抗议 , 蓝 色 标语 : ' 释 放 阿桑 硝 ” 


其 中 一 封 邮 件 显 示 , 卡 塔 尔 承诺 将 向 克林顿 基金 会 “捐助 ”100 万 ,沙特 
阿拉 伯 在 克 林 上 顿 基 金 会 成 立 之 后 ,先后 “捐助 ”了 1000 万 至 2500 万 美元 , 据 
报道 ,这 次 希拉 里 竞选 ,20% 的 竞选 资金 来 源 于 沙特 阿拉 伯 。 

这 批 邮 件 公布 后 ,美国 民众 彻底 坐 不 住 了 。2016 年 10 月 29 日 ,FBI 重 
新 启动 对 “邮件 门 ” 事 件 的 调查 ,希拉 里 的 支持 率 开始 下 跌 , 最 终 败 选 , 特 朗 普 
赢得 了 一 次 不 可 思议 的 胜利 。 

作为 一 名 普通 的 吃 瓜 群众 ,也 许 我 们 会 认为 这 些 拦截 邮件 .挖掘 隐私 的 
事情 一 定 不 会 发 生 在 自己 这 样 的 小 人 物 头 上 。 然 而 ,网 络 世界 真如 我 们 想象 
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的 这 样 友好 吗 ? 说 实话 ,即使 没有 黑客 ,没有 视 我 们 为 羔羊 的 潜在 恶意 者 为 
我 们 构造 虚假 链接 和 网 络 陷阱 ,这 些 每 天 看 似 平 淡 无 奇 的 网 络 生活 ,也 早已 
将 我 们 的 一 切 出 卖 。 

1998 年 , 拉 里 . 佩 奇 (Larry Page) 和 谢 尔 盖 . 布 林 (Sergey Brin) 在 斯 坦 
福 大 学 的 学 生 宿 舍 内 共同 开发 了 全 新 的 在 线 搜索 引擎 一 一 谷歌 。 到 如 今 , 谷 
歌 已 经 成 为 公认 的 全 球 规模 最 大 的 搜索 引擎 , 它 支 持 使 用 多 种 语言 查找 知 
识 、 地 图 ,要 闻 和 股价 ,可 以 帮助 搜索 数 十 亿 计 的 图 片 并 详 读 全 球 最 大 的 互联 
新 闻 组 (Usenet) 信 息 存 档 一 一 超过 十 亿 条 帖子 ,发 布 日 期 可 以 追溯 到 
1981 年 。 用 户 几乎 可 以 在 瞬间 得 到 相关 的 搜索 结果 ,请 注意 ,这 个 时 候 全 球 
网 民 数 量 已 经 增加 到 30 亿 。 如 何 获 取 更 多 信息 ,尤其 是 更 多 符合 当下 情景 
的 信息 并 利用 这 些 信 息 度 过 每 一 天 ,这 样 的 用 户 需求 早 就 远 远 超出 了 传统 搜 
索 查 询 的 范畴 。 谷 歌 在 不 断 发 展 中 又 推出 了 不 少 了 不 起 的 产品 ,其 中 包括 一 
些 “ 免 费 * 产 品 如 邮箱 、 地 图 \ 云 盘 和 安 卓 系 统 等 。 用 户 穿 梭 于 谷歌 的 各 项 简 
单 易 用 的 免费 服务 ,逐渐 习惯 了 使 用 这 些 * 免 费 ” 产 品 来 安排 一 天 的 生活 、 来 
往 于 各 地 并 与 彼此 保持 联系 。 其 实 , 所 有 这 些 “ 免 费 " 产 品 的 背后 ,都 在 引导 
使 用 者 不 断 透露 关于 自己 生活 轨迹 的 资料 信息 。 

从 我 们 使 用 Google 进行 网 络 搜索 开始 ,就 向 Google 敞开 了 我 们 的 隐私 
之 门 。 搜 索引 擎 利用 我 们 的 信息 ,可 以 推出 弹 窗 等 形式 的 广告 。2016 年 2 
月 ,Google 对 搜索 广告 进行 了 公司 诞生 以 来 最 大 规模 的 改版 ,将 原本 呈现 在 
搜索 结果 页 面 右 侧 的 广告 展示 栏 左 移 置顶 ,在 搜索 结果 前 插入 不 超过 4 条 的 
文字 链接 广告 (之 前 上 限 为 3 条 ) ,也 就 是 说 ,用 户 只 能 在 屏幕 更 下 侧 的 位 置 
看 到 自己 想 要 的 信息 结果 。 话 说 百度 很 早 就 在 左 侧 置顶 位 置 投放 广告 信 
息 了 。 

据 Bunnyfoot 的 研究 显示 ,有 40% 的 互联 网 用 户 无 法 区 分 Google 的 自 
然 搜 索 结 果 和 付费 广告 。 搜 索引 擎 凭借 天 然 拥 有 的 庞大 流量 ,从 投放 广告 上 
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盈利 早已 不 是 秘密 ,谷歌 母 公 司 Alphabet 2016 年 第 四 季度 财报 显示 ,其 广告 
营 收 增长 超过 17% ,达到 224 亿美 元 , 占 公 司 总 营 收 的 比例 超过 85%% ,广告 
点 击 量 增长 超过 20%, 且 仍 在 逐年 增加 。 图 7. 7 给 出 了 对 用 户 搜索 行为 进 
行 眼球 移动 轨迹 追踪 所 绘制 的 热力 图 ,可 以 看 出 ,广告 位 置 是 用 户 关注 的 热 
点 位 置 。 


图 77 对 用 户 搜索 行为 进行 眼球 移动 轨迹 追踪 所 绘制 的 热力 图 


2004 年 ,Google 推出 了 Gmail, 为 我 们 提供 电子 邮件 服务 ,Gmail 以 大 容 
量 、 高 稳定 性 迅速 赢得 了 用 户 的 赞誉 ,Gmail 号 称 用 户 永 远 不 用 删除 邮件 , 当 
前 用 户 的 典型 邮箱 大 小 已 经 达到 了 15G,Gmail 也 是 当前 为 数 不 多 的 可 以 在 
中 国正 常 使 用 的 Google 业务 。 但 与 此 同时 ,Gmail 也 通过 扫描 并 使 用 自动 
化 方式 阅读 我 们 的 邮件 以 获得 更 多 的 信息 。Google 为 什么 关心 我 们 的 邮件 
内 容 ? 其 实 就 是 为 了 通过 分 析 我 们 的 邮件 ,获得 我 们 的 偏好 信息 ,从 而 可 以 
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更 有 效 地 向 我 们 推送 广告 ,最 终 获 得 更 大 的 广告 收益 。 

2014 年 4 月 ,Google 更 新 了 其 隐私 政策 ,增加 了 下 列 内 容 :“ 我 们 的 自 
动 化 系统 将 分 析 你 的 内 容 ( 含 电子 邮件 ) 以 便 为 你 提供 相关 产品 功能 ,比如 个 
性 化 的 搜索 结果 、 量 身 定制 的 广告 以 及 垃圾 邮件 和 恶意 邮件 的 检测 功能 。 这 
些 分 析 会 在 内 容 被 发 送 、 接 收 和 储存 的 时 候 进行 。” 

一 家 专门 发 布 网 站 流量 世界 排名 的 公司 Alexa 最 新 提供 了 谷歌 网 站 下 
不 同 子 域名 所 占 的 流量 份额 数据 ,Gmail 使 用 的 子 域名 为 mail. google. com， 
统计 数据 显示 其 约 占 Google. com 流量 的 44. 14% ,在 谷歌 公司 内 部 排序 接 
近 榜 首 (图 7. 8)。 由 此 看 出 ,电子 邮件 业务 对 目前 的 互联 网 公司 仍 是 至 关 重 
要 的 , 别 忘 了 它们 可 以 从 无 数 电 子 邮 件 用 户 和 邮件 流量 中 获得 隐形 收益 , 例 
如 ,它们 能 将 用 户 导 入 其 他 内 部 服务 的 平台 (Google 曾 试 图 向 Gmail 用 户 介 
绍 Buzz 这 项 产品 )。 然 而 ,Google 表示 是 “用 户 自愿 将 信息 交 给 第 三 方 供应 
商 , 不 应 再 要 求 对 自己 隐私 进行 保护 ”也 就 是 说 ,谷歌 认为 近 4 亿 Gmail 
户 的 隐私 没有 法 律 意义 上 的 保护 。 


Where Visitors Go on Google.com Where do visitors go on google.com? 
Subdomain ”Percentof Stte Traffic 
google com 66.32% 
docs.google.com 1.45% 
adwords.google.com 1.37% 
maps.google.com 0.96% 


78 201 年 5 月 撕 ) 和 207 年 2 月 种 ) 邮 件 在 谷歌 网 站 中 的 流量 份额 占 比 , 数据 来 自 Alea 


接 下 来 ,谷歌 开始 支持 在 线 储 存 联络 人 信息 ,以 此 来 评估 我 们 的 社交 关 
系 。 想 知道 我 们 会 打 电 话 给 谁 ,于 是 就 有 了 Google Voice, 不 仅 可 以 追踪 我 
们 的 每 次 通话 ,还 能 将 语音 信息 转换 成 文字 。 为 了 让 人 们 更 加 轻松 便利 地 整 
理 照 片 和 视频 ,谷歌 发 布 了 Google Photos, 不 到 一 年 的 时 间 ,Google Photos 
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每 月 的 活跃 用 户 就 超过 了 1 亿 , 使 用 者 可 以 在 任何 设备 上 随时 找到 想 要 的 
片 ,例如 ,在 Photos 中 找到 和 “拥抱 ”有 关 的 照片 。 此 外 ,还 有 Google 地 图 ， 
基于 GPS 导航 信息 ,Google 地 图 能 够 追踪 我 们 去 过 的 一 切 地 点 。 当 我 们 询 
问 地 址 时 , 它 不 只 是 回答 某 地 点 到 另 一 地 点 怎么 走 , 根 据 不同 的 环境 和 情景 ， 
还 会 给 出 躲避 拥堵 的 最 佳 时 间 段 ,我 们 想 去 的 店铺 是 否 开 门 , 以 及 初次 游览 
的 目的 地 有 什么 精 选 推荐 。 作 为 终极 大 杀 器 ,Google 还 设计 了 安 卓 操作 系 
统 ,Google 坚信 智能 手机 是 时 时 刻 刻 带 在 用 户 身边 的 ,有 了 安 卓 系统 ， 
Google 就 能 轻松 地 追踪 我 们 一 整 天 的 行为 。 

Google 提醒 用 户 们 上 传 到 谷歌 的 所 有 内 容 都 将 被 一 视 同仁 地 对 待 ,其 
对 新 版 隐私 政策 的 阐述 如 下 : 

“ 当 你 上 传 .提交 、 储 存 、 发 送 或 接收 内 容 至 我 们 的 服务 时 ,你 就 赋予 了 谷 
歌 (以 及 我 们 的 合作 伙伴 ) 在 全 球 范围 使 用 托管. 储存 、 再 生产 ,修改 、 创 建 衍 
生 内 容 ( 比 如 根据 你 的 内 容 翻 译 、 改 编 或 进行 其 他 修改 而 得 到 结果 ,我 们 那样 
做 的 目的 是 让 你 的 内 容 能 够 更 好 地 与 我 们 的 服务 兼容 )、 传 播 .发布 . 公 开演 
示 、 公 开 显 示 和 散布 这 些 内 容 的 权利 。” 

不 论 在 Youtube、Google 十 还 是 Gmail 等 服务 上 ,新 版 隐私 政策 的 标识 
都 已 经 十 分 显眼 。 然 而 ,Google 对 用 户 数 据 的 使 用 还 在 继续 深入 ,除了 这 些 
服务 外 ,还 打算 一 口气 将 旗下 60 多 种 在 线 服 务 全 都 整合 形成 单一 的 数据 库 。 
Google 执行 董事 施 密 特 曾 在 2009 年 接受 CNBC 采访 时 提 及 :“ 在 美国 境内 ， 
我 们 受到 《爱国 者 法 案 》 的 约束 ,将 这 些 信息 透漏 给 美国 官方 并 不 是 没有 可 
能 .这 也 意味 着 我 们 所 处 的 网 络 环境 中 ,除了 互联 网 公司 会 搜集 用 户 的 数据 
信息 ,政府 也 在 无 时 无 刻 想 要 监控 我 们 的 数据 信息 。 

2013 年 6 月 5 日 ,美国 中 央 情 报 局 前 技术 雇员 爱德华 . 斯 诺 登 
《 卫 报 》 和 美国 (华盛顿 邮 报 ) 爆 料 ,揭露 了 美国 国家 安全 局 (NSA) 等 美国 政府 
部 门 监视 公民 隐私 的 “棱镜 ?计划 项 目 , 斯 诺 登 称 该 项 目 自 2007 年 启动 ,美国 
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国家 安全 局 已 经 "直接 监视 美国 9 家 最 主要 网 络 公司 的 中 央 服 务 器 ”, 一 向 标 
榜 “ 坚 决 捍卫 公民 隐私 和 人 权 ” 的 美国 政府 ,陷入 到 巨大 的 与 论 旋 窝 之 中 。 此 
后 一 连 串 的 新 闻 报道 更 加 印证 了 : 全 球 的 网 络 和 数据 通信 , 正 处 在 以 美国 政 
府 为 主导 的 监控 之 下 。 

在 英国 ( 卫 报 》 公 布 的 一 段 长 达 12 分 钟 的 专访 视频 中 ,斯 诺 登 说 道 :“ 你 
什么 错 都 没有 ,但 你 却 可 能 成 为 怀疑 的 对 象 ,也 许 只 是 因为 一 次 拨 错 了 的 电 
话 ,他 们 就 可 以 用 这 个 项 目 仔细 调查 你 过 去 的 所 有 决定 ,审查 所 有 跟 你 交谈 
过 的 朋友 ,并 在 这 一 基础 上 对 你 发 起 攻击 ,他 们 就 这 样 怀疑 一 个 无 辜 的 人 ,把 
你 当成 一 个 做 过 错 事 的 人 来 对 待 。 

斯 诺 登 注定 将 成 为 “国家 利益 "和 “公民 隐私 ”之 间 予 盾 演变 最 具 冲 击 力 
的 一 个 传奇 。 多 数 网 民 认 为 他 是 “英雄 ”, 他 勇敢 地 向 大 众 公 开 了 真相 ,美国 
政府 则 称 他 “背叛 祖国 ”, 是 受到 一 系列 “严重 刑事 指控 ”的 通 给 犯 。 

也 许 很 多 人 对 “国家 监控 ”一 事 多 少 有 所 耳闻 ,然而 当 斯 诺 登 真 真 切切 地 
证 实 了 它 的 存在 时 ,人 们 还 是 难免 会 不 安 、 排 斥 甚至 抗议 。 事实 上 ,从 古 至 
今 ,无 论 哪 朝 哪 代 的 政府 都 或 多 或 少 采 取 过 监控 公民 的 措施 。 而 这 些 监 控 行 
为 一 旦 曝光 ,大 都 会 引发 “政务 机 密 ” 和 “公民 隐私 ”之 间 关 系 的 广泛 讨论 。 美 
国人 不 由 得 拿 自 己 与 小 说 (41984) 里 的 主人 公 温 斯 顿 进行 对 比 , 美 国 奥巴马 政 
府 和 反 奴 部 门 则 忙 不 迭 地 四 处 解释 ,监控 系统 是 为 了 确保 公共 安全 ,并 非 要 
偷 抠 本 国民 众 的 隐私 。 

事实 上 ,保障 公共 安全 确实 是 事实 。 美 国联 邦 调查 局 副 局 长 肖 恩 : 乔 伊 
斯 在 一 次 听证 会 上 列举 了 4 起 依靠 监听 被 阻止 的 恐怖 袭击 案件 ,其 中 包括 
2009 年 未 遂 的 纽约 地 铁 炸 弹 袭击 。 美 国 国家 安全 局 局 长 、 美 军 网 络 司令 部 
司令 基 思 :亚历山大 也 表示 :“ 自 ‘9: 11’ 事 件 发 生 以 来 ,通过 这 些 监视 项 
目 , 我 们 已 成 功 阻止 了 近 50 起 可 能 的 恐怖 袭击 ,但 具体 细节 就 不 方便 公开 
了 ,因为 如 果 我 把 这 些 说 出 去 , 丽 怖 分 子 就 会 知道 我 们 是 怎么 追踪 他 们 的 。” 
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然而 ,CNN 公共 安全 分 析 师 .新 美国 基金 会 国家 安全 研究 计划 负责 人 彼 
得 . 伯 根 (Peter Bergen) 反 驶 称 ,新 美国 基金 调查 了 自 *9. 11” 以 来 有 关 圣 战 
组 织 矶 怖 分 子 的 法 庭 记 录 和 媒体 报道 ,发 现在 挫败 恐怖 袭击 的 过 程 中 ,发 挥 
最 主要 作用 的 仍然 是 传统 的 合法 手段 。 也 就 是 说 , NSA 的 监听 项 目 是 缺乏 
说 服 力 的 大 范围 “钓鱼 ”项 目 。 所 以 在 质疑 者 看 来 ,仅仅 公布 四 个 案例 是 不 够 
的 ,公众 需要 更 多 的 例证 来 判断 他 们 所 做 出 的 牺牲 是 否 值 得 。 

斯 诺 登 唱 爆 “棱镜 门 ”之 后 ,其 他 国家 的 一 些 监 控 项 目 也 逐渐 浮 出 水 面 。 

“这 不 仅 是 美国 的 问题 。 英 国 在 这 场 斗 争 中 也 在 扮演 狠 角 色 , 英 国政 府 
通信 总 局 的 作为 甚至 比美 国 还 恶劣 .斯 诺 登 对 英国 4 卫 报 ?说 。 据 报道 ,英国 
情报 机 构 政府 通信 总 部 GCHQ 在 过 去 一 年 半 的 时 间 里 ,对 多 条 承担 国际 电 
话 和 互联 网 信号 的 光缆 系统 进行 秘密 监控 ,不 但 拦截 和 存储 了 海量 的 私人 通 
话 ` 电 邮 ` 浏 览 记 录 等 数据 ,还 与 美国 国家 安全 局 彼此 共享 信息 。 

值得 注意 的 是 ,GCHQ 可 对 从 光纤 获得 的 海量 数据 储存 30 天 并 进行 分 
析 。 这 一 行动 的 代号 为 “Tempora”,2011 年 正式 投入 使 用 。 监 控 光 纤 的 技术 能 
力 使 得 英国 政府 通信 总 局 成 为 情报 界 的 超级 力量 。 该 机 构 的 互联 网 监控 能 力 
是 美国 .英国 ,加 拿 大、 澳大利亚. 新西兰 五 大 监视 窃听 联盟 成 员 中 最 强 的 。 

“Tempora”" 事 件 曝光 后 ,英国 相关 部 门 的 辩解 与 美国 情报 部 门 的 说 法 何 
其 相似 : 这 些 数据 收集 都 有 监管 机 制 , 它 们 中 的 许多 信息 对 及 时 发 现 和 防范 
重大 犯罪 颇 有 功劳 。 为 了 国家 安全 而 进行 的 秘密 监控 是 否 应 该 公之于众 ? 
在 反恐 监控 和 保护 公民 隐私 上 ,如 何 做 到 更 符合 民主 性 要 求 的 平衡 ? 对 于 这 
些 问题 , 像 爱德华 斯 诺 登 一 样 的 自由 主义 者 更 加 相信 : 透明 与 个 人 隐私 才 
是 自由 社会 的 基石 ,保密 与 监督 是 暴政 的 大 门 。 

在 全 球 与 论 关 注 和 疑虑 中 ,斯 诺 登 在 互联 网 上 留 下 了 他 的 回答 :“ 我 不 
希望 上 带 知 道 我 是 谁 。” 
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隐私 的 边界 在 哪里 


“互联 网 上 的 一 切 免费 平台 、 免 费 服务 和 免费 内 容 都 需要 定向 广 
单 ”, 亚 历 山 大 。 和 福 尔 纳 斯 在 (大 西洋 月 刊 》 上 曾 坦言 “而 定向 广告 的 交 
其 盈利 程度 又 将 依赖 于 对 用 户 数据 的 搜集 和 整理 。 

Google 使 用 我 们 的 个 人 数据 搜集 并 分 析 处 理 出 不 同 种 类 的 价值 信息 ， 
最 终 都 体现 到 了 市 值 里 。 这 么 做 的 公司 当然 不 只 有 Google 一 家 ,可 以 说 这 
是 目前 几乎 所 有 互联 网 公司 的 普遍 做 法 (具体 他 们 是 如 何 凭借 用 户 数据 获 
得 收益 的 算法 在 之 前 的 章节 曾 做 介绍 ) 。 这 是 一 场 几乎 没有 人 明确 点 头 的 
交易 ,不 论 你 是 否 愿意 ,都 已 参与 其 中 。 互 联网 公司 免费 使 用 我 们 的 各 种 
数据 ,并 赚 取 丰厚 的 收益 ,同时 作为 交换 ,提供 给 我 们 那些 看 似 “ 免 费 ” 的 
服务 。 

为 什么 我 们 如 此 在 乎 自己 的 隐私 , 却 会 将 自己 认为 如 此 重要 的 隐私 以 很 
低 的 成 本 出 卖 ? 美国 著名 的 波士顿 咨询 公司 (BCG) 曾 在 2013 年 针对 人 们 如 
何 看 待 个 人 数据 隐私 这 一 问题 在 多 个 国家 进行 了 调查 。 调 查 中 ,个 人 数据 被 
分 为 姓名 \ 年 龄 性 别 、 财 务 、 子 女 、 健 康 、 通 话 记录 社交 网 络 信 息 等 多 个 项 目 ， 
各 国民 众 普 遍 认为 个 人 财务 信息 属于 最 为 隐私 的 内 容 , 其 中 中 国 和 日 本 的 民 
众 表现 出 来 的 隐私 观念 要 比 其 他 国家 更 淡薄 。 对 于 大 多 数 的 个 人 数据 项 目 ， 
日 本 受 访 者 基本 只 有 10% ~~30% 认 为 属于 个 人 隐私 ,即便 是 公认 的 最 为 敏 
感 的 个 人 财务 信息 ,也 只 有 34% 的 日 本 受 访 者 认为 这 是 隐私 。 具 体 结果 如 
图 7.9 所 示 。 

也 就 是 说 ,人 们 在 判断 什么 数据 属于 个 人 隐私 上 是 存在 差异 的 。 多 数 人 
并 不 知道 有 多 少 关于 自己 的 数据 正在 被 收集 ,以 及 其 潜在 代价 和 收益 是 什 
么 。 相 反 , 当 你 的 隐私 数据 被 善意 利用 时 ,会 让 你 感觉 如 同 享受 到 了 “私人 定 


254 


第 7 章 谁 来 保护 我 们 的 隐私 


和 毕 尹 省 竺 草 世 蚂 羽 对 人 旬 YYV 十 关 闻 关 


世 班 里 “ 限 半 富国 浪 “` 国 潍 国产 : 愉 了 尹 国王 栈 疯 :天 
肝 攻 是 阅 Y 氏 中 各 圳 引 轩 。 术 Y 旦 座 Y 多 对 台 非 者 Yt 全 


匡 | 


号 6/ 国 


255 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


制 ? 的 服务 ,完全 不 知道 越 来 越 多 地 暴露 自己 的 隐私 数据 其 实 也 是 一 件 存在 
风险 的 事情 。 

在 “棱镜 门 ” 事 件 曝 光 后 ,人 们 也 开始 重新 审视 网 络 安全 和 个 人 隐私 问 
题 。2014 年 ,一 项 由 约瑟夫 . 朗 特 里 改革 基金 会 发 起 的 调查 显示 ,85% 的 网 
民 认 为 ,上 网 浏览 记录 等 信息 的 保密 工作 “相当 重要 ”; 英 国 市 场 调研 公司 
Mori 的 调查 也 显示 , 仅 有 12%% 的 受 访 者 认为 这 些 隐私 是 否 被 监控 无 所 谓 。 
与 上 述 两 项 数据 形成 对 比 的 是 ,美国 大 规模 监控 计划 刚 被 揭露 的 时 候 , 仅 有 
约 40% 的 网 民 在 意 自己 的 隐私 是 否 被 监控 。 

尽管 民众 针对 “网 络 隐私 保护 ”的 呼声 甚嚣尘上 ,但 结果 往往 像 是 一 个 钟 
摆 随 着 不 同 的 时 期 事件 左右 晃动 。2015 年 12 月 ,美国 加 州 圣 伯 纳 迪 诺 出 现 
了 恐怖 袭击 ,28 岁 的 赛 义 德 . 法 鲁 克 和 他 29 岁 的 妻子 塔 什 芬 ， 马 利克 对 一 
家 社会 服务 机 构 发 起 袭击 ,造成 14 人 死亡 。 随 后 ,两 人 在 同 警方 的 枪战 中 死 
亡 。 联 邦 执法 人 员 在 他 们 的 汽车 上 找到 一 部 iPhone 手机 ,但 是 苹果 公司 拒 
绝 帮 助 解锁 这 一 嫌犯 手机 。 虽 然 联邦 法 官 匹 姆 之 后 裁决 要 求 苹果 公司 为 联 
邦 调查 局 提供 能 够 解除 手机 安全 功能 、 避 免 多 次 解锁 不 成 功 自动 消除 数据 的 
方法 ,但 苹果 CEO 库 克 表示 ,美国 政府 对 iPhone 手机 的 要 求 是 危险 的 ,这 无 
异 于 美国 政府 在 要 求 围绕 苹果 手机 加 密 功 能 创建 一 个 “后 门 ”, 并 指出 这 样 的 
要 求 “没有 先例 ”。 

美国 独立 民 调 机 构 皮 尤 中 心 针 对 “苹果 对 抗 FBI” 事 件 做 了 一 项 调查 , 结 
果 发 现 超过 一 半 的 美国 民众 支持 FBI 解锁 枪击 案 中 的 iPhone。 而 网 络 调查 
公司 SurveyMonkey 的 调查 结果 几乎 与 其 一 致 ,有 趣 的 是 ,这 份 调查 还 显示 ， 
只 有 16% 的 受 访 者 读 过 库 克 针 对 此 事 发 表 的 公开 信 , 但 在 读 过 该 公开 信 的 
受 访 者 中 ,超过 50% 支 持 苹果 (图 7. 10 和 图 7. 11)。 当 时 许多 媒体 在 报道 
SurveyMonkey 的 调查 时 ,几乎 不 约 而 同 地 强调 了 是 否 读 过 公开 信 这 一 区 
别 ,不免 让 人 思索 : 对 苹果 解锁 iPhone 的 后 果 有 更 深 理 解 的 人 ,是 不 是 就 更 
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容易 站 到 苹果 这 一 边 ? 换言之 ,是 否 不 支持 苹果 的 人 只 是 因为 对 隐私 缺乏 起 
码 的 认 知 ? 


图 710 加 州 圣 伯 纳 迪 诺 枪击 案 后 , 民众 支持 苹果 表态 


half say Apple should unlock 
和 0 38% A 


图 711 5% 的 受 访 者 支持 Bl, 仅 有 38% 支持 苹果 


明知 隐私 可 能 受到 侵犯 却 依然 要 加 入 FBI 们 的 阵营 ,以 及 明明 介意 政府 
天 探 自己 的 隐私 却 在 保护 隐私 的 行动 上 表现 出 迟钝 ,这 些 似乎 都 暗示 了 一 个 
问题 入 们 并 不 是 不 在 乎 自己 的 隐私 可 能 泄露 ,而 是 , 当 他 们 权衡 隐私 与 安 
全 或 是 其 他 因素 时 ,不仅 无 知 也 时 常 抱 有 一 种 侥幸 心理 。 在 苹果 与 FBI 的 争 
执 中 ,硅谷 大 佬 挨个 站 队 ,17 家 科技 公司 向 法 庭 联名 递交 法 律 文件 声援 苹 


全 
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果 ,科技 公司 不 断 强调 给 政府 开 后 门 可 能 出 现 的 “滑坡 效应 "@。 如 果 说 , 科 
技 公司 关注 的 是 ,“ 万 一 解锁 技术 落 入 不 法 分 子 之 手 会 怎么 样 ” 或 是 “万 一 政 
府 提出 进一步 的 监控 要 求 该 怎么 办 ”, 那 么 普通 民众 关心 的 可 能 就 是 ,“ 我 会 
不 会 成 为 那个 万 分 之 一 的 受害 者 。” 

2016 年 皮 尤 又 做 了 一 项 调查 ,结果 发 现 尽 管 担心 隐私 的 人 比 不 担心 
隐私 的 人 略 多 一 些 , 但 真正 从 行动 上 保护 个 人 隐私 的 人 却 很 少 。 在 所 有 上 听 
说 过 政府 监听 计划 的 受 访 者 中 , 仅 有 1/4 的 人 表示 他 们 因此 改变 了 使 用 各 
种 技术 的 方式 ,比如 更 改 隐 私 设置 .和 卸载 某 些 应 用 或 定期 修改 密码 ,如 
图 7.12 所 示 。 


|Surveillance Programs Prompt Some to 
|Change the Way They Use Technology 
|Among the 87% of U.S. adults who have heard of the 
[government surveillance programs, the percentage who 
|have changed their use of ... “a great deal” or 
“somewhat” 


Emailaccounts :sx 
search engines BW 17 
socal meda ses I 15 
colphones BW 15 
Mobie apps WW 13 
Tor messages BW 13 
Landine phones BW 。 


ee EE 


|Source: Survey of 475 adults on GIK panel November 26. 2014- 
Hanuary 3. 2015. 
|PEW RESEARCH CENTER 


图 7 人 2 约 1U 受 访 者 表示 在 御 镜 门 ”" 后 改变 了 使 用 技术 的 方式 


@ “滑坡 效应 ”(Slippery Slope) 在 还 辑 学 中 是 指 : 如 果 我 们 今天 允许 一 件 相对 无 害 的 事情 发 
生 , 我 们 可 能 会 启动 了 一 个 趋势 ,最 终结 果 是 ,我 们 眼下 认为 不 可 想象 的 事情 也 会 发 生 和 被 接受 。 
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对 于 隐私 边界 的 模糊 认识 ,以 及 对 隐私 保护 技术 所 涉及 的 知识 和 成 本 
(比如 更 换 聊天 工具 、 安 装 反 监 控 软 件 ) 的 缺乏 了 解 ,使 得 人 们 在 面 对 隐 私 安 
全 问题 时 更 加 脆弱 。 

尽管 我 们 是 无 足 轻重 的 小 人 物 ,但 我 们 的 隐私 真 的 将 变 得 无 处 通 逃 吗 ? 


在 岗 倪 中 寻求 算法 保护 


“大 富 丛 ”(Monopoly) ,又 名 "地产 大 享 ” 或 “强手 棋 ”, 是 一 款 经 典 的 多 人 
策略 型 棋盘 游戏 。 游 戏 中 ,参与 者 需要 搓 鹏 子 前 进 , 同 时 使 用 多 种 道具 、 卡 
片 ,通过 买 地 、 建 楼 、 收 取 过 路 费 等 方式 来 与 对 手 进行 财富 比拼 。 坚 持 到 最 
后 ,能 迫使 其 他 对 手 破产 的 玩家 获得 胜利 。 

据 估 计 , 自 1904 年 最 初版 本 推出 以 来 大 富 箱 ? 是 世界 上 最 多 人 玩 过 的 
棋盘 游戏 ,人 数 可 能 超过 6 亿 。 但 鲜 为 人 知 的 是 ,在 第 二 次 世界 大 战 中 , 它 还 
承担 了 一 项 秘密 使 命 , 英 军 正 是 依靠 大 富翁 棋 , 从 德军 手中 营救 出 无 数 的 英 
军 战 停 。 可 以 说 :“ 没 有 大 富 公 ,就 没有 现在 的 英格兰 。” 

一 一 詹姆斯 。 于 勒 (James Yule) ,英国 陆军 中 校 

在 第 二 次 世界 大 战 中 ,德军 有 20 多 万 英 军 俘虏 ,其 中 包括 大 批 飞行 员 。 
当时 飞行 员 非常 稀缺 ,所 以 英国 秘密 情报 局 成 立 了 一 个 战 时 组 织 “ 军 情 九 
处 ”, 专 门 帮 助 营 救 英 军 战俘 ,特别 是 飞行 员 。 

遵照 日 内 瓦 公约 ,当时 德国 允许 英国 慈善 基金 会 等 公益 组 织 向 战俘 营运 

衣物 等 物资 ,其 中 也 包括 娱乐 游戏 和 棋牌 等 。 英 国 军 情 九 处 曾 通 过 
这 些 组 织 多 次 向 战俘 营 里 输送 逃生 工具 ,比如 藏 着 收音 机 元 件 的 棒球 , 藏 有 
地 图 的 黑 胶 唱片 , 藏 在 鞋 跟 里 的 小 刀 , 伪 造 身份 证 等 ,结果 都 被 德军 一 一 识 
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破 了 。 

“大 富翁 ?游戏 中 设置 了 各 种 各 样 的 游戏 道具 ,尤其 是 包含 地 图 .钱币 等 ， 
对 于 战俘 逃跑 ,工具 和 地 图 都 是 必要 物品 ,所 以 英国 情报 局 注意 到 了 这 款 游 
戏 ,并 开始 投入 大 量 精力 进行 重新 修改 和 设计 。 首 先是 如 何 绘制 用 于 逃跑 的 
地 图 ,采用 纸 质 地 图 不 容易 保存 . 遇 水 容易 破损 ,如 果 展 开 纸 质地 图 也 会 发 出 
较 大 的 响声 ,容易 被 德军 发 现 。 于 是 ,英国 情报 局 想到 了 使 用 丝绸 ,1941 年 
英国 情报 局 与 擅长 丝绸 印刷 的 瓦 丁 顿 公司 (Waddingtons) 秘密 达成 了 协议 ， 
选 
息 


择 了 一 处 狭小 .安全 的 车 间 , 只 有 极 少数 员工 参与 ,各 自分 工 将 一 切 秘密 信 
头 及 所 有 逃生 出 口 都 印 制 在 了 游戏 地 图 当中 ,第 一 款 特 别 版 “大 富翁 ?游戏 
棋 诞 生 了 。 

这 款 特别 版 游戏 里 ,不 仅 有 标准 的 游戏 道具 ,例如 角 子 .房屋 模型 .机 会 
卡 和 苏格兰 犬 ,还 增加 了 暗藏 的 金属 铂 刀 ,指南针 等 特殊 道具 ,其 中 的 丝绸 地 
图 一 并 标注 了 逃生 路 线 上 所 有 可 供 躲 藏 的 安全 场所 。 另 外 ,各 套 特别 版 游戏 
棋 所 装 入 的 特制 道具 略 有 不 同 , 有 的 游戏 棋 中 通过 一 些 马 太 福 音 真 言 , 巧 妙 
地 传递 着 情报 信息 (图 7. 13) ,甚至 还 有 一 些 游戏 棋 里 ,部 分 游戏 币 被 替换 成 
了 德国 ,意大利 和 法 国 等 国家 的 真实 货币 ,以 保证 战俘 在 逃跑 途中 可 以 使 用 。 


图 713 战俘 营 中 正在 进行 大 富翁 棋 游戏 
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漠 助 与 多 家 英国 当地 慈善 基金 会 合作 ,英国 情报 局 慢 慢 地 将 特别 版 大 富翁 
游戏 (棋盘 上 停车 场 的 右 下 角 有 个 红 点 ) 混 入 普通 版 游戏 棋 中 一 起 送 入 了 德军 战 
俘 营 。 为 了 防止 这 一 逃生 工具 再 次 被 德军 发 现 ,监狱 里 秘密 组 成 一 个 “逃跑 委员 
会 >, 收 到 各 种 逃跑 工具 后 大 家 都 先 交 给 逃跑 委员 会 ,委员 会 只 负责 保管 工具 并 
不 会 询问 工具 的 来 源 , 谁 计划 逃跑 就 可 以 向 逃跑 委员 会 申请 工具 。 这 样 做 的 目 
的 是 为 了 避免 有 人 叛变 ,叛徒 也 不 会 知道 工具 到 底 是 隐藏 在 了 什么 物资 里 。 就 
这 样 ,特别 版 大 富翁 游戏 成 了 二 战 期 间 唯 一 没 被 德军 识破 的 情报 工具 。 据 二 战 
结束 时 估计 ,从 德军 战俘 营 中 成 功 逃 出 的 战俘 超过 35 000 人 (图 7. 14) 。 


714 大 富翁 棋 与 被 解救 的 英国 飞行 员 


这 段 惊 险 悲 壮 的 逃生 之 旅 ,不仅 巧 妙 地 把 各 种 工具 隐藏 在 大 富翁 棋 中 ， 
而 且 通 过 切断 大 富翁 棋 与 逃跑 工具 之 间 的 关联 ,使 得 大 富翁 棋 像 一 般 物 品 一 
样 在 诸多 物资 中 隐匿 起 来 ,保护 了 重要 的 情报 信息 。 这 些 在 军事 上 经 常 使 用 
的 情报 隐藏 方法 也 为 今天 的 数据 隐私 保护 提供 了 思路 。 


把 隐私 匿名 


爱德华 . 斯 诺 登 第 一 次 写 邮 件 给 《 卫 报 ) 记 者 格 伦 : 格林 沃 德 (Glenn 
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Greenwald, 曾 报道 过 美国 “棱镜 ”计划 ?时 ,使 用 了 一 种 PGP 邮件 加 密 软件 。 
不 过 , 据 《 连 线 ) 网 站 介绍 ,斯 诺 登 还 使 用 了 另 一 项 匿名 技术 , 即 一 个 名 为 
Tails 的 便携 口袋 式 匿名 操作 系统 (图 7. 15)。 


图 7 全 Tails 匿 名 操作 系统 


Tails 匿名 操作 系统 9 不 会 在 本 地 存储 任何 用 户 数据 ,防止 遭受 恶意 软 
件 攻击 ,最 重要 的 是 Tails 可 以 保护 数据 信息 的 来 源 。 没 有 人 知道 Tails 的 
发 明 者 是 谁 ,Tails 的 开发 成 员 们 一 直 保 持 匿 名 ,不 仅 保护 了 自己 的 身份 , 同 
时 也 保护 了 Tails 的 代码 避免 受到 美国 国家 安全 局 (NSA) 的 施 压 和 干涉 。 
根据 Tails 开发 成 员 们 的 说 法 :“ 那 时 我 们 已 经 是 匿名 网 络 Tor 的 爱好 者 ,并 
是 参与 开源 自由 软件 社区 好 几 年 。Google、Facebook、Yahoo 等 网 络 巨 头 和 
国家 情报 机 关 为 了 自己 的 利益 ,希望 每 个 人 的 生活 在 网 络 上 变 得 越 来 越 透 
明 ,我 们 想 要 对 抗 这 种 威胁 个 人 隐私 的 趋势 。 我 们 发 现 网 络 上 缺少 的 是 一 
工具 箱 , 可 以 将 所 有 保护 隐私 的 加 密 工 具 整 合 起 来 ,让 普通 用 户 也 能 够 很 方 
便 地 使 用 。.” 斯 诺 登 泄露 的 一 份 文件 中 显示 ,NSA 当局 在 一 个 幻灯 片 里 曾 抱 


@ Tails 匿名 操作 系统 的 开源 网 站 : https: //tails. boum. org/ 。 
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怨 Tails, 因 为 该 匿名 操作 系统 对 NSA 不 利 ,这 也 意味 着 Tails 对 隐私 保护 是 
有 用 的 ,任何 人 如 果 对 Tails 存 有 怀疑 ,可 以 随时 进行 检查 ,所 有 Tails 操作 
系统 的 代码 都 是 开源 的 。 

最 初 ,Tails 匿名 操作 系统 来 个 名 为 Amnesia( 健 忘 症 ) 的 软件 项 目 ， 


随后 与 一 个 已 有 操作 系统 Incognito( 隐 身 出 行 ) 融 合 形成 了 The Amnesic 


Incognito Live System, 首 字母 缩写 为 Tails。 目 前 ,Tails 除了 有 核心 小 组 在 
对 笔记 本 和 人 台式 机 的 桌面 操作 系统 进行 研究 ,还 有 独立 小 组 在 Android 和 
Ubuntu 平板 上 开发 移动 版 本 操作 系统 。 实 际 上 ,Tails 是 一 个 匿名 处 理 的 完 
整 Linux 操作 系统 (主要 是 基于 Debian GNU/Linux), 它 的 设计 独立 于 计算 
机 原 有 操作 系统 ,可 以 安装 在 DVD 光盘 、U 盘 和 SD 卡 上 ,不 仅 支持 随身 携 
带 ,而 且 需 要 时 可 以 直接 用 Tails 启动 计算 机 ,之 后 计算 机 联网 会 自动 运行 
Tor 匿名 网 络 。 如 果 关 闭 Tails, 计 算 机 将 重新 启动 其 原 有 的 操作 系统 。 

Tails 可 以 帮助 我 们 在 线 匿名 使 用 互联 网 ,同时 它 的 配置 特别 注意 不 去 使 用 
计算 机 的 硬盘 ,即使 它们 之 间 有 一 些 交 换 空间 也 是 如 此 。Tails 使 用 的 唯一 存储 
空间 是 内 存 RAM( 断 电 自 动 擦 除 存储 内 容 ), 所 以 Tails 允许 我 们 在 任何 计算 机 上 
使 用 敏感 数据 信息 ,比如 在 酒店 的 计算 机 或 图 书 
馆 的 计算 机 上 进行 操作 ,我 们 不 会 留 下 任何 数据 
使 用 的 痕迹 或 任何 存储 记录 ,并 在 关闭 计算 机 后 
避免 我 们 的 数据 被 恢复 。Tails 的 这 种 性 质 被 称 
为 “失忆 ”, 能 够 更 好 地 保护 个 人 隐私 ,如 果 我 们 明 
确 地 要 求 它 ,就 可 以 将 特定 的 文档 显 式 存储 到 另 
一 个 口 盘 或 外 部 硬盘 上 ,并 将 其 带 走 以 备 将 来 使 
。 纪 录 片 导演 劳 拉 ' 珀 特 阿 斯 (Laura Poitras， 
拍摄 的 《第 四 公民 》(Citizenfour) 获 得 2015 年 第 ”图 ?1 第 外 届 奥 斯 卡 最 佳 纪录 


87 届 奥 斯 卡 最 佳 纪 录 长 片 奖 ,图 7. 16) 使 用 Tails ER) 
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匿名 操作 系统 时 说 道 :“ 虽 然 Tails 的 安装 和 验证 略 有 麻烦 ,一 旦 完成 了 设置 再 使 
用 起 来 是 非常 简单 的 。” 

Tails 作为 一 个 隐私 保护 的 工具 箱 , 预先 配置 了 许多 加 密 程 序 和 匿名 工 
具 , 最 为 知名 的 就 是 匿名 网 络 Tor。Tor 是 由 全 球 志愿 者 共同 组 成 的 匿名 计 
算 机 网 络 , 它 允许 用 户 以 完全 匿名 的 方式 浏览 及 访问 互联 网 ,帮助 用 户 完全 
隐藏 网 络 使 用 记录 且 不 受 地 域 限制 。 现 在 使 用 Tor 匿名 网 络 的 用 户 很 多 ,大 
部 分 是 想 要 保护 隐私 的 普通 入 ,但 也 包括 了 非法 交易 的 成 员 、 极 端 分 子 、 军 
方 .通缉 犯 等 ,任何 工具 在 保护 普通 人 的 同时 也 都 会 被 犯罪 分 子 利 用 ,这 似乎 
是 不 可 避免 的 ,不 能 因为 刀 可 以 用 来 实施 犯罪 ,就 不 让 普通 人 买 刀 啊 ! 


洋葱 网 络 一 一 一 个 谷歌 看 不 见 的 世界 


Tor 的 核心 算法 是 “洋葱 路 由 (The Onion Router)”, 在 20 世纪 90 年 代 中 期 ， 
由 美国 海军 研究 实验 室 的 数学 家 保罗 “' 西 维 森 (Paul Syverson) ,计算 机 科学 家 
迈克 ' 里 德 (G，Mike Reed) 和 大 卫 ' 戈 尔 德 施 拉 格 (David Goldschlag) 发明, 用 
于 对 美国 的 数据 情报 通信 进行 保护 。 现 在 的 Tor 项 目 是 自由 软件 ,并 由 一 个 位 
于 马萨诸塞 州 的 非 营 利 组 织 The Tor Project 进行 维护 。 

2015 年 10 月 ,自由 程序 员 卢 克 … 米尔 兰 达 (Luke Millanta, 来 自 悉 尼 ) 
通过 一 个 名 为 “Onionview” 的 计划 ,分 析 了 Tor 匿名 网 络 的 现 有 规模 和 发 展 
情况 并 感叹 :“ 人 们 谈 及 Tor 网 络 以 为 是 一 小 气 使 用 者 在 地 下 室 里 隐蔽 操作 
着 计算 机 实现 的 ,如 果 他 们 看 到 Onionview 地 图 结果 就 会 发 现 , “天 啊 , 全 球 
看 上 去 至 少 已 经 有 6000 个 Tor 网 络 节 点 了 。”” 其 中 ,德国 的 总 节点 数 有 
1364 个 ,已 超过 了 位 居 第 二 的 美国 (1328 个 ), 如 图 7. 17 所 示 。 

2016 年 初 ,数据 可 视 化 软件 公司 Uncharted 也 发 布 了 “TorFlow” 计 划 的 
观测 结果 ,除了 德国 和 美国 ,拥有 较 多 Tor 节点 数量 的 国家 还 有 法 国 、 荷 兰 、 
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The anonymous 
Internet 


图 717 Tor 匿 名 网 络 每 日 用 户 数量 实时 地 图 


英国 和 俄罗斯 (图 7.18)。TorFlow 还 显示 出 了 一 些 我 们 料想 不 到 的 Tor 市 
点 位 置 ,例如 利比亚 和 利比里亚 ,这 里 不 仅 有 民众 在 使 用 Tor 网 络 ,也 存在 着 


Tor 志愿 主机 节点 。6 年 前 ,Tor 匿名 网 络 还 只 有 2000 个 主要 节点 ,如 今 


Tor 网 络 已 经 彻底 去 中 心 化 并 由 分 布 于 全 球 的 6425 个 节点 组 成 。 每 年 下 载 
Tor 软件 的 用 户 近 5000 万 人 次 , 连 Tor 的 发 明 者 们 都 承认 ,自己 也 无 力 摧毁 
Tor ys 


St uncharted 


£: uncharted 


图 718 Taflow 计 划 于 20B 年 上 诺 ) 和 2016 年 个 ) 观 测 到 的 Tor 节 点 数量 和 变化 趋势 
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Tor 在 短 时 间 内 成 为 全 球 应 用 最 为 广泛 的 匿名 网 络 之 一 ,不 仅仅 在 于 它 
能 够 隐藏 用 户 访问 网 络 的 真实 身份 , 它 同 样 使 得 各 类 网 络 服务 提供 者 可 以 隐 
藏 自己 的 身份 和 服务 器 所 在 的 位 置 。 某 个 Tor 使 用 者 可 以 通过 Tor 隐匿 服 
务 功能 建立 网 站 ,其 他 Tor 用 户 也 可 以 在 网 站 上 发 布 资料 信息 ,他 们 不 用 担 
心 会 被 追踪 或 遭 到 审查 ,因为 没有 人 能 够 确定 到 底 是 谁 在 运行 网 站 ,即使 是 
网 站 运行 者 也 不 知道 到 底 是 谁 发 布 了 那些 数据 。 例 如 ,中 东 地 区 的 Tor 用 户 
创建 了 一 个 网 站 转载 西方 媒体 的 新 闻 报 道 , 可 以 使 用 Tor 软件 .Tor 的 主机 ， 
借助 Tor 网 络 “ 介 绍 点 ”(introduction points) 来 引导 所 有 想 要 访问 网 站 内 容 
的 人 ,以 介绍 点 的 地 址 连接 这 个 隐藏 的 网 站 ,但 是 没有 人 能 找到 其 真实 位 置 ， 
网 站 访问 者 互相 也 都 不 知道 对 方 的 真正 网 络 标识 。 这 就 是 所 谓 的 “洋葱 网 
站 ”, 常 规 的 搜索 引擎 是 无 法 到 达 这 样 的 网 络 空间 的 , 它 也 由 此 得 到 一 个 更 为 
和 狂人 听闻 的 名 字 “ 上 暗 网 ”Tor 为 “ 暗 网 ”提供 了 一 个 秘密 掩体 ,因此 Tor 也 被 
认为 是 开启 了 一 个 “谷歌 看 不 到 的 世界 ”。 

Tor 匿名 网 络 通过 一 系列 中 间 计 算 机 又 叫 中 继 节点 ( 即 志愿 者 计算 机 ) ,在 
我 们 的 终端 计算 机 和 访问 目的 地 之 间 建 立 起 一 系列 的 跳跃 式 连接 ,简单 来 说 ， 
Ter 是 想 要 用 一 条 拐弯 抹 角 的 、 难 以 辨认 的 路 径 甩 掉 任 何 跟踪 我 们 的 人 
(图 7.19)。 当 用 户 启动 一 个 Ter 代理 客户 端 时 , 它 将 会 从 Ter 的 目录 服务 器 
获取 Tor 网 络 的 节点 列表 。 接 下 来 ,客户 端 会 在 网 络 中 任意 选择 一 跳 中 继 节点 
建立 加 密 连 接 , 该 加 密 连 接 会 在 匿名 网 络 中 逐 跳 扩 展 , 直 至 到 达 目 的 地 。 例 如 ， 
用 户 Alice 通过 三 个 中 继 节点 访问 目的 地 Bob, 如 图 7. 20 所 示 , 实 线 连接 箭头 
表示 加 密 通 信 , 而 虚线 连接 箭头 表示 一 般 未 加 密 连 接 。 在 Alice 和 Bob 的 通信 
中 ,每 个 中 继 节点 只 知道 自己 从 上 一 跳 节 点 接收 数据 以 及 向 下 一 跳 节点 发 送 
数据 ,其 他 部 分 都 是 加 密 不 可 见 的 。 这 就 意味 着 第 一 个 节点 只 知道 连接 的 发 
起 者 而 不 知道 目的 地 ,最 后 一 个 节点 只 知道 连接 的 目的 地 而 不 知道 发 起 者 , 没 
有 单独 一 个 中 继 节点 会 知道 数据 的 完整 传输 路 径 。 这 样 一 来 ,即使 攻击 者 使 
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用 嗅 探 技术 或 直接 攻击 了 某 个 中 继 节 点 ,也 不 会 获得 这 次 连接 的 完整 信息 , 难 
以 实施 消息 和 来 源 的 追踪 。 最 后 ,如 果 用 户 Alice 再 一 次 访问 Bob 或 者 另 一 个 
目的 地 Jane, 客 户 端 将 会 重新 选择 中 继 节点 建立 不 同 的 连接 路 径 。 


How TOr Works: 


图 7f Tor 匿 名 网 络 创 建 连接 示意 图 


洋葱 网 络 ,顾名思义 ,用 户 的 客户 端 在 发 送 数据 时 ,会 对 Tor 数据 包 进行 
层 层 加 密封 装 形成 像 洋 萄 一样 的 结构 。 一 个 数据 包 经 过 Tor 网 络 的 各 个 中 
继 节点 传输 ,其 头 部 被 一 层 一 层 解 密 剥 去 ,最 后 一 跳出 口中 继 节 点 会 完成 
一 层 解密 ,得 到 真正 的 目的 地 信息 。 
由 于 Tor 路 由 算法 采用 了 多 重 路 由 的 模式 ,其 网 络 传输 效率 会 受到 一 定 
4 影响 ,为 了 减少 性 能 开销 , Tor 网 络 在 建立 连接 时 使 用 RSA 加 密 , 而 在 传输 
实际 数据 时 使 用 速度 较 快 的 AES 加 密 。 构 成 中 继 节点 的 志愿 者 计算 机 ,并 不 
需要 运行 特别 的 硬件 ,只 是 配置 Tor 软件 ,他 们 的 计算 机 会 贡献 一 部 分 带宽 资 
源 支 持 Tor 网 络 运行 ,如 果 加 入 Tor 网 络 的 志愿 计算 机 越 多 ,那么 Tor 网 络 的 
传输 能 力 会 更 强 , 防 止 Tor 的 用 户 信息 被 追踪 的 效果 也 会 更 好 。 针 对 一 些 关 于 
Tor 网 络 是 否 会 产生 危害 的 争论 , Ter 项 目 主页 还 发 表 了 一 项 “为 什么 Tor 不 
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连接 启动 


连接 


Tor 如 何 工作 : 1 rn 
一 ”加 秦 链 路 


习 ”6 个 节点 和 4 个 用 户 


Alice bal eae Jane 
绢 总 时 晤 


Tor 如 何 工 作 : 2 ws 
一 加 记 链 路 


ed ee 


Bob 
1 


连接 超时 -入 口 节点 变化 


Tor 如 何 工作 : 3 Fw 


一 个 真实 场景 -多 功能 节点 
or 人 I 作 : 4 en 


9 不 节点 和 3 不 用 户 Tfor 节 点 
A: Alice 连接 Bob B: Bob 连接 Dave 


Ji Jane 连接 Alice D: Dave 连接 Jane 


图 72 洋葱 路 由 算法 工作 原理 示意 图 


会 帮助 犯罪 ”的 精彩 声明 ,Tor 的 项 目 组 成 员 们 相信 ,“Tor 的 存在 对 犯罪 行为 
的 帮助 并 不 会 比 Internet 多 。” 这 人 句 话 笔者 个 人 是 非常 同意 的 。 
除了 Tor,Tails 匿名 操作 系统 上 还 装载 了 其 他 的 加 密 工具 ,如 PGP、 密 


但 管理 系统 KeePassX .聊天 加 密 插 件 


私密 。 


Tails 中 有 一 些 办 公 应 用 ,如 Open Office`.GIMP、Audacity, 但 它 并 
适合 在 我 们 的 日 常 网 络 活动 中 使 用 ， 


Off-the-Record 等 。 这 些 应 用 都 经 过 
修改 ,并 提升 了 安全 性 。 当 然 ,没有 操作 系统 和 加 密 工具 可 以 保证 完全 的 


由 于 平日 里 我 们 总 是 需要 使 用 一 些 


EB] 


自己 身份 有 关 的 网 络 服务 ,这 样 会 将 我 们 完全 暴露 。 因 此 开发 者 们 建议 | 
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户 : 应 该 在 一 些 需 要 保持 匿名 的 特殊 活动 中 使 用 Tails。 


被 算法 设计 的 隐私 保护 


夏 洛 克 : 我 昨天 第 一 次 见 到 你 时 间 你 是 去 过 阿富汗 还 是 伊拉克 ,你 好 像 
很 惊讶 。 

华 生 : 对 。 你 到 底 怎 么 知道 的 ? 

夏 洛 克 : 你 的 发 型 .站 立 姿 势 说 明 你 是 军人 出 身 。 但 你 说 的 话 有 点 时 过 
境 迁 ,说 明 在 巴 蒋 医 院 受 训 过 ,所 以 显然 是 军医 。 脸 上 晒 黑 了 但 手腕 却 没有 ， 
说 明 你 从 国外 回来 ,但 不 是 日 光 浴 。 你 走路 跋 得 厉害 , 却 宁愿 站 着 也 不 要 求 
坐 下 ,所 以 多 少 有 点 心理 疾病 ,导致 你 创伤 的 最 初 原因 ,应 该 是 在 战场 上 受 
伤 。 战 场 加 上 晒 黑 , 那 就 是 阿富汗 或 伊拉克 。 

一 一 《神探 夏 洛克 ), 第 一 季 第 一 集 

夏 洛克 ' 福尔摩斯 (Sherlock Holmes) 与 约翰 ， 华 生 (John Watson) 在 
第 一 次 相遇 时 , 曾 使 出 了 浑身 解数 只 为 了 让 对 方 喜欢 自己 ,对 于 即将 合租 同 
一 幢 公 寓 的 华 生 , 夏 洛克 习惯 性 地 给 出 了 自己 恰到好处 的 推理 ,这 些 推 理 都 
与 华 生 并 不 想 向 外 公开 的 实际 情况 相 吻 合 。 现 实生 活 中 ,如 果 没 有 高 智商 和 
大 量 的 背景 知识 , 短 时 间 内 做 到 夏 洛 克 这 样 的 完美 推理 似乎 很 难 ,但 是 有 了 
互联 网 .有 了 大 数据 相关 技术 ,找到 那些 隐藏 起 来 的 事情 ,似乎 又 变 得 简单 
起 来 。 

下 面 给 个 例子 ,网 友 仅仅 根据 王 咯 丹 在 微 博 中 贴 出 的 图 片 和 说 过 的 话 就 
推断 出 她 曾经 居住 的 地 址 。 
第 一 步 : 信息 获取 ;素材 : 两 张 照片 。 
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网 友 从 王 歼 丹 的 博客 和 微 博 中 选取 了 两 张 图 片 ,一 张 是 从 窗 内 俯 睫 小 区 
绿化 植物 的 照片 ,一 张 是 从 窗 内 拍摄 的 窗外 全 景 图 。 网 友 认 为 照片 透露 了 几 
个 主要 信息 : 第 一 ,楼 体外 观 和 窗 框 难 擦 干净 的 痕迹 ,说 明 这 是 已 经 建成 一 
段 时 间 的 西式 小 区 。 第 二 , 王 歼 丹 家 在 高 层 。 第 三 ,小 区 内 有 三 个 在 一 条 直 
线 上 大 小 一 样 的 正方 形 花坛 。 

第 二 步 : 区 域 筛 选 ;素材 : 4 条 微 博 留言 .电子 地 图 。 

王 歼 丹 微 博 1:“ 四 环 堵 死 了 , 联 排 迟 到 了 .。? 这 说 明 , 她 家 在 四 环 外 。 

王 歼 丹 微 博 2:“ 演 出 这 么 多 年 ,还 没有 在 北京 中 心地 带 买 一 套房 子 。” 这 
说 明 ,说 明 她 家 不 在 市 中 心 。 

王 煞 丹 微 博 3:“ 和 爸爸 送 我 和 小 6 去 给 (无 人 驾驶 ;配音 ,光顾 着 看 微 博 留 
言 , 忘 记 给 老 爸 指 路 ,车 都 开 到 中 关 村 了 !?”( 和 区 爸 开始 路 艺 我 说 开导 航 吧 ) 这 
说 明 ,她 家 不 在 中 关 村 及 进 城 路 过 中 关 村 的 地 方 。 
王 歼 丹 微 博 4:“ 患 了 严重 的 痢疾 ,20 分 钟 后 赶 到 了 附近 的 一 所 小 医 
院 .” 这 说 明 , 她 家 周边 无 大 医院 。 

网 友 继续 将 北京 城区 地 图 划 为 9 个 区 域 。 根 据 微 博 留言 用 排除 法 分 析 
区 所 在 地 。 

第 三 步 : 网 络 搜索 ;素材 : 电子 地 图 。 

网 友 在 电子 地 图 上 截取 锁定 区 域 俯视 图 ,放大 局 部 寻找 王 歼 丹 照 片 中 有 
标志 性 花坛 的 小 区 ,很 快 就 找到 目标 。 
第 四 步 : 实地 核对 ;素材 : 照片 。 

该 网 友 亲 身 前 往 这 个 小 区 ,现场 拍摄 照片 ,与 王 歼 丹 所 发 的 照片 进行 比 
较 , 确 认 推理 正确 。 


Ea 
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如 果 开 始 推理 


由 于 网 络 服务 本 身 的 技术 特点 以 及 我 们 日 常 的 很 多 网 络 活动 自然 带 有 
身份 标识 ,关于 我 们 的 这 些 网 络 行动 就 自然 沉淀 为 数据 。 对 于 这 样 的 数据 ， 
我 们 是 否 还 可 以 借助 匿名 化 的 方式 在 不 同 的 数据 应 用 接触 到 数据 之 前 实现 
隐私 保护 ? 另 一 方面 ,对 于 提供 各 类 “免费 ”服务 的 网 络 公司 来 说 ,真正 有 价 
值 的 是 大 数据 中 某 个 群体 的 统计 特性 而 非 某 个 特定 用 户 的 具体 信息 ,很 多 车 
名 的 隐私 保护 匿名 算法 也 是 在 这 一 背景 下 产生 的 。 那 么 问题 来 了 ,如 果 能 在 
防止 隐私 数据 泄露 的 同时 又 能 保持 数据 集 的 可 用 性 就 完美 了 ,是 否 存在 这 样 
的 算法 ? 

匿名 化 的 算法 思想 其 实 由 来 已 久 ,最 开始 一 个 简单 的 想法 就 是 去 掉 数 据 
集中 那些 起 到 唯一 标识 作用 的 信息 ,例如 ,美国 某 个 人 口 普查 记录 当中 
(图 7.21 左 ) 包 含 社会 保险 号 (SSN) .出 生日 期 (DOB) 性别. 邮编 和 工资 收 
入 的 信息 ,如 果 我 们 将 起 到 唯一 标识 作用 的 社会 保险 号 SSN 去 掉 , 对 公布 出 
来 的 数据 集 ( 图 7. 21 右 ) 进 行 定义 , 即 包含 两 类 信息 : 类 标识 信息 (QI) 和 敏 
感 属 性 信息 (SA)。 直 观 上 ,凭借 上 述 两 类 信息 ,将 无 法 明确 获知 某 个 人 对 应 
的 工资 收入 值 , 在 一 定 程度 上 具有 匿名 化 的 作用 。 但 是 ,在 遇 到 链接 攻击 


publish 


图 72 美国 某 人 口 普查 记录 表 去 唯一 标识 处 理 
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(Linking Attack) 情 况 下 ,结合 不 同 的 背景 知识 进行 推理 ,这 种 匿名 化 作用 就 
十 分 微弱 了 。 

研究 者 们 发 现 , 以 比较 容易 得 到 的 注册 选民 信息 登记 表 为 背景 知识 ， 
通过 将 上 述 人 口 普 查 记 录 和 注册 选民 信息 登记 表 做 链接 推理 ,攻击 者 就 很 
容易 得 出 大 部 分 在 选民 信息 登记 表 出 现 过 的 人 的 工资 收入 值 ( 见 图 7. 22) 。 
一 份 研究 报告 指出 ,有 87% 以 上 的 美国 人 可 以 由 他 们 生日 .性别 和 邮政 编 
码 的 组 合 唯 一 确定 。 一 旦 攻击 者 已 知 Adam Smith 的 生日 .性 别 和 邮政 编 
码 分 别 是 W276、Male 和 53715, 那 么 他 只 要 稍 加 推理 就 能 知道 Adam 
Smith 的 工资 收入 是 50 000 美元 ,这 样 Adam Smith 的 隐私 信息 仍然 被 泄 
露 了 。 


De-identified table 


on [sox] ap Tsaar] 
[a/13/86 | F | 53715 |55,000| 


External knowlad 


| auV76 | M | 53703 | ssooo | 
4/13/86 53706 | 70,000 
2/28/76 53706 | 75,000 


图 72 人 口 普 查 记 录 和 注册 选民 信息 登记 表 的 链接 推理 


由 此 可 见 ,数据 发 布 者 既 不 清楚 数据 接收 者 所 拥有 的 背景 知识 ,也 难以 
对 数据 接收 者 如 何 使 用 数据 进行 控制 ,真正 实现 数据 匿名 化 并 不 是 一 项 简单 
的 工作 。 

美国 在 线 AOL 就 曾 因 匿名 化 不 足 而 导致 数据 泄露 ,这 是 较 早出 现 的 全 
球 重大 数据 泄露 事件 之 一 。2006 年 8 月 ,AOL 承认 将 1900 万 条 用 户 搜索 查 
询 记录 在 网 上 进行 过 发 布 ,这 些 信息 涉及 65. 8 万 AOL 用 户 以 及 1080 多 万 
条 不 一 样 的 搜索 词 ,时 间 跨 度 为 3 个 月 。AOL 声称 ,该 数据 的 发 布 仅 作 为 非 
商业 用 途 , 主 要 是 为 了 向 研究 机 构 提 供 新 的 研究 工具 。 对 于 研究 人 员 来 说 ， 
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如 果 要 进行 搜索 记录 中 的 关键 词 分 析 ,这些 真实 的 来 自主 流 搜索 引擎 的 最 新 
资料 可 是 相当 宝贵 ,AOL 的 两 名 员工 就 在 这 些 数据 的 基础 上 撰写 了 一 份 名 
为 “搜索 概览 ”>(A Picture of Search) 的 研究 论文 。 

虽然 在 公布 这 些 搜索 查询 记录 之 前 ,AQL 已 经 将 用 户 标识 去 除 ,并 将 同 
一 用 户 的 搜索 条 目 与 任意 标识 链接 ,但 是 仍然 有 一 些 攻击 者 成 功 锁定 了 某 个 
日 户 个 体 ,特别 是 《纽约 时 报 》 报 出 ,通过 搜索 AOL 第 4417749 号 用 户 搜索 记 
录 , 最 终 找到 了 乔治 亚 州 Lilburn 市 62 岁 的 寡妇 Thelma Arnold。Thelma 
Arnold 进行 的 搜索 查询 是 : 

“现在 是 访问 意大利 的 最 佳 季 节 。” 

一 一 AOL 第 441 7749 号 用 户 Thelma Arnold 的 搜索 查询 

AOL 的 这 次 意外 事件 发 生 后 ,AOL 首席 技术 官 CCTO) 莫 琳 ， 戈 文 
(Maureen Govern) 引 咎 辞职 。 有 关 此 次 泄露 事件 的 一 位 技术 开发 人 员 和 他 
的 主管 也 相继 辞职 。 就 在 莫 琳 失去 其 职位 前 ,她 在 一 次 主题 演讲 中 说 道 , 随 
着 互联 网 的 演进 “大 公司 仍 将 是 大 公司 ”随后 ,AOL 迎 来 的 却 是 倒霉 的 
鹏 年: 


k- 匿 名 和 /- 多 样 性 


为 了 降低 实施 链接 攻击 的 可 能 性 ,研究 人 员 考 虑 是 否 可 以 通过 去 除 一 些 
类 标识 QI 信息 或 对 其 进行 泛 化 处 理 来 实现 更 好 的 匿名 效果 。 例 如 ,在 之 前 
提 到 的 美国 人 口 普查 记录 表 中 ,我 们 执行 元 组 抑制 (tuple suppression) 或 QI 
属性 泛 化 (QI attribute generalization) 处 理 ,简单 地 说 ,就 是 去 除 一 行 的 信息 
或 泛 化 一 列 甚至 多 列 的 信息 ,原始 数据 表 就 变 成 了 缺少 部 分 数据 的 加 工 数据 
表 ( 见 图 7.23)。 但 这 样 处 理 的 结果 是 ,加 工 数据 表 丢 失 了 一 些 信 息 条 目 而 
损失 了 数据 可 用 性 , 却 没 有 很 好 地 保护 其 他 数据 隐私 ( 见 图 7. 23(a)) ,或 者 
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仍 存在 部 分 较为 独特 的 信息 条 目 会 被 链接 攻击 查找 出 来 ( 见 图 7. 23(b) )。 
由 此 看 来 ,我 们 需要 考虑 的 一 个 关键 问题 是 : 数据 匿名 化 到 什么 程度 才能 
满足 隐私 保护 的 需求 ? 


[566 [Sex ap TS | 
4/13/86 | F 53715 | 55,000 
2/28/76 | M 53703 | 60,000 
4/13/86 | F .53706 | 70.000 
2/28/76 F 53706 | 75,000 


| _ Name | DOB Sex| zip | 


Adam Smith |1/21/76 M | 53715 


图 723 元 组 抑制 或 9 属性 泛 化 处 理 后 的 数据 表 


通过 观察 ,研究 者 们 进一步 发 现 ,对 于 每 条 记录 在 数据 表 中 很 可 能 会 与 
不 止 一 项 类 标识 匹配 ,是 不 是 只 要 我 们 在 属性 相近 的 记录 之 间 进 行 类 标识 泛 
化 处 理 , 就 可 以 很 好 地 做 到 隐私 保护 呢 ? 1998 年 ,Samarati 和 Sweeney 提出 
了 一 种 大 匿名 (k-anonymization) 隐 私 保护 算法 , 它 要 求 发 布 的 数据 中 存在 一 
定数 量 (至 少 为 k) 的 在 类 标识 符 上 不 可 区 分 的 记录 ,使 攻击 者 不 能 判别 出 隐 
私信 息 所 属 的 具体 某 个 个 体 , 从 而 保护 了 个 人 隐私 , 太 匿 名 通过 参数 指定 
户 可 承受 的 最 大 信息 泄露 风险 。 举 例 来 说 ,我 们 对 之 前 提 到 的 美国 人 口 普 
查 记 录 表 再 次 进行 二 匿名 处 理 , 当 & 取 2 时 ,加 工 数据 表 中 ( 见 图 7. 24) 就 会 
存在 两 条 相同 的 {1/21/76, * ,537 x* } 记 录 ,那么 (Adam Smith,1/21/76,M， 
53715} 这 条 记录 被 精确 查找 到 的 可 能 性 就 是 1/2。 即 -匿名 保证 了 单独 个 
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体 被 准确 标识 的 概率 最 多 为 1/。 


Good utility 
Good privacy 


|55,000 | 
[as Ea a Dg 


azar7e | * | s37°* | 75.000] 


Generalization with k-anonymity 


图 7 人 -匿名 数据 表 &=2) 


然而 ,上 匿名 真 的 能 够 保证 信息 不 会 被 泄露 吗 ? 对 于 敏感 属性 ,其 实 大 
匿名 算法 未 进行 任何 限制 ,如 果 A 个 信息 条 目 被 看 作 一 个 等 价 类 的 话 ,这 个 
等 价 类 中 的 敏感 属性 太 过 接近 也 会 暴露 我 们 极力 想 要 保护 的 隐私 数据 。 此 
时 ,攻击 者 仍然 可 以 实施 同 质 性 攻击 和 背景 知识 攻击 ,下 面 我 们 就 给 大 家 展 
示 一 下 这 两 种 攻击 的 具 

现在 某 个 医疗 机 构 对 外 将 要 发 布 一 份 医疗 数据 ,我 们 划分 类 标识 为 邮编 
(Zip Code)、 年 龄 (Age) 和 国籍 (Nationality), 敏感 属性 为 所 患 病症 
(Condition)。 原 始 数 据 表 经 过 -匿名 化 处 理 后 (k= 二 4) 如 图 7. 25 所 示 。 


Data table of k-anonymity, where A=4 


Non-Sensitive Sensitive 
Zip Code Age Nationality Condition 
1 130** <30 , Heart Disease 
2 130** <30 区 Heart Disease 
3 130P* <30 家 Viral Infection 
4 130°* <30 Viral Infection 
3 1485* >=40 pg Cancer 
6 1485* >=40 让 Heart Disease 
4 1485* >=40 a Viral Infection 
8 1485* >=40 Wd Viral Infection 
9 130** 2 机 Cancer 
10 130°* 3 和 Cancer 
11 130* Ww Cancer 
12 130°* FE 要 Cancer 


图 75 人- 匿名 化 &= 4 处 理 后 的 数据 表 
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同 质 性 攻击 


假设 某 一 天 Jack 得 知 邻 居 David 突然 病 倒 被 送 进 了 医院 ,于 是 Jack 想 
要 猜测 David 到 底 得 了 什么 病 。 偶 然 间 Jack 在 网 络 上 获取 到 了 David 所 在 
医院 发 布 的 经 过 4- 匿 名 化 处 理 的 病人 数据 信息 表 。 因 为 Jack 事先 知道 邻居 
David 是 32 岁 的 美国 人 ,他 们 居住 的 地 区 邮编 是 13064, 所 以 Jack 很 容易 发 
现 David 的 医疗 记录 号 应 该 是 9、10、11 或 12 中 的 一 个 。 特 别 是 这 4 条 医疗 
记录 均 显 示 病 人 患 有 癌症 ,因此 Jack 可 以 分 析出 邻居 David 所 得 的 疾病 是 
癌症 。 

从 以 上 分 析 过 程 我 们 可 以 看 到 ,采用 链接 或 推理 的 方法 ,攻击 者 可 以 从 

数据 集中 判断 出 某 个 目标 所 在 的 等 价 类 ,假如 这 个 等 价 类 的 各 记录 条 目 对 应 
的 敏感 属性 值 都 是 一 样 的 , 毫 无 疑问 ,攻击 者 就 可 以 清楚 地 知道 该 目标 的 敏 
感 属性 值 是 什么 , 即 目 标 患 者 的 隐私 信息 遭 到 泄露 。 所 以 ,k- 匿 名 无 法 阻止 
同 质 性 攻击 。 
k- 匿 名 产生 的 等 价 类 所 包含 的 敏感 属性 如 果 缺 乏 多 样 性 ,将 直接 影响 数 
据 隐 私 安全 ,但 是 这 种 情况 并 不 在 少数 。 我 们 来 做 一 个 粗略 估算 ,假设 某 一 
数据 集 具有 80 000 条 不 同 的 记录 ,并 且 对 应 只 有 5 种 不 同 的 敏感 属性 (敏感 
属性 与 类 标识 QI 信息 没有 关联 ) 。 若 对 这 个 数据 集 执行 4- 匿 名 化 处 理 大 约 
可 以 得 到 20 000 个 等 价 类 。 进 一 步 地 ,平均 每 125 个 等 价 类 就 会 出 现 一 个 
等 价 类 中 所 有 记录 条 目的 敏感 属性 值 相同 , 即 不 具备 多 样 性 。 因 此 ,上 述 
20 000 个 等 价 类 中 将 大 约 有 160 个 等 价 类 不 具备 多 样 性 ,相当 于 640 个 记录 
对 象 可 能 会 受到 同 质 性 攻击 的 威胁 。 由 此 我 们 可 以 看 到 ,即使 经 过 -匿名 化 
处 理 的 数据 集 ,拥有 相同 类 标识 QI 信息 的 记录 条 目 之 间 ,仍然 需要 保证 敏感 
属性 值 具有 一 定 的 多 样 性 特点 。 
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背景 知识 攻击 


Jack 还 有 一 个 微 信 好 友 Aaron, Aaron 在 朋友 圈 中 也 曾 晒 出 去 过 David 
就 诊 的 同一 家 医院 ,假设 Aaron 的 医疗 数据 信息 也 包含 在 已 发 布 的 病人 数据 
信息 表 中 (如 图 7. 25 所 示 )。Jack 事先 已 知 Aaron 是 25 岁 和 日 本 国籍 ， 
Aaron 现在 的 居住 地 邮政 编码 是 13055, 由 此 Jack 可 以 初步 判断 出 Aaron 的 
医疗 记录 信息 存在 于 1、2.、3 或 4 中 。 如 果 没 有 更 多 的 参考 信息 ,Jack 此 时 并 
不 能 确定 Aaron 曾 患 心脏 病 还 是 病毒 性 感染 。 然 而 ,结合 背景 知识 ,日 本 人 
在 世界 人 口中 患 心脏 病 的 比率 非常 低 ,所 以 Jack 几乎 可 以 推测 出 Aaron 的 
就 诊 病史 是 病毒 性 感染 。 基 于 以 上 分 析 ,k- 匿 名 也 不 能 保证 数据 信息 不 会 受 
到 背景 知识 攻击 。 

为 了 解决 匿名 化 的 数据 表 仍 然 会 泄露 敏感 属性 值 这 个 问题 ,2006 年 
Machanavajjhala 等 人 提出 了 多样 性 匿名 保护 算法 , 它 要 求 每 个 等 价 类 中 至 少 
存在 :个 “ 较 好 表现 的 ”敏感 属性 值 ( 即 1 种 敏感 属性 值 互 不 相同 )。 对 上 -多样 性 
匿名 算法 更 一 般 化 的 表述 是 ,假设 有 一 个 等 价 类 G,G 中 所 有 元 组 的 敏感 属性 
取 值 中 出 现 最 频繁 的 取 值 为 v, 出 现 的 次 数 为 c(), 如 果 clv) /| G | 二 =1N4(] 
Gl 是 G 中 的 元 组 数 ) ,那么 G 就 满足 -多 样 性 。 按 照 这 种 定义 ,划分 后 的 每 个 
等 价 类 对 应 的 敏感 属性 值 分 布 将 会 比较 平均 ,避免 出 现 极端 的 情况 。 

这 次 我 们 对 该 医疗 机 构 所 要 发 布 的 医疗 数据 表 进 行 3- 多 样 性 处 理 ( 如 
图 7. 26 所 示 ) ,随后 把 它 和 图 7. 27 作对 比 ,能够 看 到 上 面 针对 4- 匿 名 化 数据 
表 的 攻击 在 这 个 3- 多 样 性 数据 表 中 并 不 能 奏效 。 例 如 ,Jack 无 法 从 这 个 3- 
多 样 性 数据 表 中 判断 出 David(32 岁 、 美 国 国籍 ,住址 邮编 13064) 是 癌症 患 
者 。 特 别 是 Aaron(25 岁 \ 日 本 国籍 住址 邮编 13055) 患 有 心脏 病 的 可 能 性 
非常 小 ,Jack 也 不 能 推测 出 Aaron 到 底 是 病毒 性 感染 患者 还 是 癌症 患者 。 
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Data table of diversity where [=3 


Non-Sensitive Sensitive 
Zip Code Age Nationality Condition 
1 1305* <=40 和 Heart Disease 
4 1305* <=40 * Viral Infection 
9 1305* <=40 be Cancer 
10 1305* <=40 Wd Cancer 
5 1485* >40 各 Cancer 
6 1485* >40 " Heart Disease 
7 1485* >40 * Viral Infection 
8 1485* >40 * Viral Infection 
2 1306* <=40 齐 Heart Disease 
3 1306* <=40 本 Viral Infection 
11 1306* <=40 ' Cancer 
12 1306* <=40 让 Cancer 
72% 1- 多 样 性 4 =3) 处 理 后 的 数据 表 
差分 隐私 保护 


-匿名 和 1- 多 样 性 算法 主要 是 基于 对 数据 集 进 行 扰动 实现 隐私 匿名 保 
护 ,这 两 种 算法 的 不 足 之 处 在 于 没有 严格 的 定义 攻击 模式 ,也 没 办 法 量化 攻 
击 者 可 能 具有 的 背景 知识 ,导致 这 两 种 算法 只 适用 于 一 些 特定 场景 下 的 背景 
知识 攻击 ,在 实际 应 用 上 存在 很 大 的 局 限 性 。 

FE ,Dwork 等 人 首次 提出 了 差分 隐私 保护 算法 , 它 被 公认 为 是 比较 


2010 稀 


严格 和 强健 的 保护 模型 。 这 一 算法 与 大 


匿名 和 二- 多样 性 算法 不 同 之 处 在 于 ， 


它 需 要 基于 隐私 函数 来 实现 对 数据 集 的 保护 , 它 的 基本 思想 是 对 原始 数据 、 
对 原始 数据 的 转换 或 者 是 对 统计 结果 添加 噪音 来 达到 隐私 保护 效果 。 该 算 
法 可 以 确保 在 某 一 数据 集中 插入 或 者 删除 一 条 记录 的 操作 不 会 影响 任何 计 


算 的 输出 结果 。 另 外 ,该 算法 不 关心 攻 刘 
已 经 掌握 了 除 某 一 条 记录 之 外 的 所 有 记录 的 信息 ,该 条 记录 的 隐私 也 不 会 被 


者 所 具有 的 背景 知识 ,即使 攻击 者 


汇 露 。 差 分 隐私 保护 算法 最 大 的 优点 是 ,虽然 基于 数据 失真 技术 ,但 所 加 入 
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的 噪声 量 与 数据 集 大 小 无 关 , 因 此 对 于 大 型 数据 集 , 仅 通 过 添加 极 少量 的 只 
声 就 能 达到 高 级 别 的 隐私 保护 。 

具体 来 说 ,给 定 两 个 相近 的 数据 集 D 和 D'( 后 面 称 为 兄弟 数据 集 ) ,二 
者 互相 之 间 至 多 相差 一 条 记录 信息 , 即 | DAD'| 科 1, 给 定 一 个 隐私 算法 A， 
Range(A) 为 A 的 取 值 范围 , 若 算法 A 作用 在 兄弟 数据 集 D 和 D' 上 任意 输 
出 结果 O(OE Range(A) ) 满 足下 列 不 等 式 , 则 我 们 认为 算法 A 满足 e- 差 分 
隐私 。 


Pr[A(D)= O]/Pr[A(D’)= O]<e 一 1 十 e (1) 
其 中 ,概率 Pr[: ] 由 算法 A 的 随机 性 控制 ,也 代表 了 隐私 被 披露 的 风险 。 在 
差分 隐私 保护 算法 的 实现 中 ,隐私 算法 A 构造 数据 集 D 到 O 的 映射 时 一 般 
需要 引入 噪音 机 制 , 拉 普 拉 斯 是 一 种 最 为 常见 的 也 是 最 为 基本 的 差分 隐私 噪 
声 机 制 之 一 ,通过 拉 普 拉 斯 分 布 产生 品 音 实现 对 真实 值 的 扰动 并 最 后 得 到 查 
询 返 回 值 。 
举 个 简单 的 例子 ,对 于 某 个 医疗 数据 集 , 当 攻击 者 查询 包含 Mary 的 
条 记录 中 患 癌症 的 人 数 时 ( 见 图 7. 27) ,第 一 次 的 返回 结果 是 35 人 ,攻击 者 
再 执行 一 次 不 包含 Mary 的 同样 记录 查询 ,第 二 次 的 返回 结果 若是 34, 那 么 
就 泄露 了 Mary 患 有 癌症 这 一 隐私 信息 , 同 理 返 回 结 果 若 是 35, 攻 击 者 就 知 
道 Mary 没有 患 癌症 。 


User Database 


Tell me f(x) 


第 1 次 : 35 


f(x)+noise 第 2 次 : 34?35 


< 


图 72 攻击 者 查询 包含 lery 的 n 条 记录 中 患 癌症 的 人 数 


经 过 差分 隐私 保护 ,对 医疗 数据 集 的 查询 会 出 现 什么 不 一 样 的 效果 呢 ? 
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查询 结果 会 返回 一 个 围绕 真实 值 波动 的 某 种 分 布 结 果 ,分 布 结果 根据 加 
入 的 噪声 的 分 布 情况 而 定 ,但 是 由 于 有 查询 成 本 限制 ( 即 次 数 限制 ) ,不 会 让 
攻击 者 在 限制 次 数 内 得 到 整个 分 布 结果 ,所 以 攻击 者 不 会 获知 真实 值 是 
多 少 。 

同时 ,实际 返回 的 查询 结果 将 会 满足 e 不 可 区 分 属性 ,在 表达 式 (1) 中 ， 
当 e 足够 小 趋 近 0 值 时 ,兄弟 数据 集 D 和 D’' 映 射 得 到 的 输出 结果 均 为 O 的 
概率 比值 几乎 为 1, 即 得 到 结果 O 的 概率 几乎 相等 。 也 就 是 表明 ,不 论 攻击 
者 的 查询 请 求 里 是 否 包含 Mary, 两 次 返回 的 结果 是 35 的 概率 几乎 相等 ,如 
果 攻 击 者 据 此 认为 Mary 没有 得 癌症 ,就 会 得 到 错误 的 判断 ,因为 Mary 有 可 
能 患 有 癌症 。 因 此 攻击 者 就 再 也 不 能 从 查询 结果 中 轻易 地 推断 出 某 项 隐私 
信息 了 。 

对 于 加 入 的 拉 普 拉 斯 噪声 ,实际 上 是 满足 拉 普 拉 斯 分 布 的 一 个 随机 值 。 
拉 普 拉 斯 分 布 的 概率 密度 函数 表示 如 下 : 


R= 喜 xp(~ -| (2) 


其 中 ,噪声 是 x-Laplace(j, 0) ,位 置 参数 是 jy, 尺度 参数 是 5 二 0。 该 分 布 的 图 
像 (如 图 7. 28 所 示 ) 是 一 个 尖 沙 堆 形 状 。 

为 了 保证 引入 拉 普 拉 斯 噪声 后 ,兄弟 数据 集 D 和 D' 关 于 隐私 函数 A 的 
上 映射 作用 仍然 满足 差分 隐私 保护 的 要 求 ,我们 取 0 一 Ar/s, 噪 声 z 为 Laplace 
(Af/e) ,噪声 大 小 与 Af 成 正比 ,与 s 成 反比 。 

之 前 我 们 已 经 知道 ,e 越 小 ,兄弟 数据 集 D 和 D' 越 难 区 分 , 即 隐 私 保护 效 
果 越 好 。 这 里 我 们 也 可 以 看 到 ,e 越 小 ,引入 的 噪声 越 大 ,在 概率 分 布 函数 中 反 
映 真实 值 的 最 高 点 相应 的 会 出 现 尺度 和 位 置 上 的 变化 和 偏 移 , 当 查询 预算 有 
限 ( 即 查询 次 数 满足 隐私 保护 预算 条 件 下 ) 时 ,攻击 者 是 无 法 推断 出 最 高 点 真实 
值 的 。 但 是 数据 集 的 统计 特性 基本 保持 不 变 , 带 来 了 较 好 的 数据 集 可 用 性 。 
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-10 -8 -6 = -2 0 2 4 6 8 10 
—— mu=0 b=] —— mu=0 b=2 


——— mu=0 b=4 一 mu 一 5 b=4 


图 7B 拉 普 拉 斯 概率 密度 函数 分 布 


共 建 数据 隐私 新 秩序 


数据 的 勘探 者 看 到 了 数据 的 价值 , 那 确实 是 令 人 激动 的 价值 ,这 不 仅仅 
是 为 了 一 已 之 私 或 纯粹 的 经 济 利益 ,他 们 想 通 过 数据 来 构建 美丽 的 新 世界 。 
一 一 埃 里 克 。 西 格 尔 (Eric Siegel) 《大 数据 预测 》 


数据 使 用 需要 秩序 的 约束 和 保护 
就 像 人 类 掌握 了 火 是 迈 向 文明 的 第 一 次 伟大 实践 ,人 们 对 数据 的 大 规模 


使 用 再 一 次 将 文明 推进 到 赛 博时 代 。 卡 耐 基 梅 隆 大 学 的 汤姆 . 米 切 尔 (Tom 
Mitchell) 教 授 曾 在 (科学 ) 杂 志 上 写 道 :“ 对 于 定位 数据 (通过 GPS 对 手机 追 
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踪 实施 定位 ) 的 应 用 可 使 我 们 获得 各 类 福利 ,例如 减少 交通 拥堵 、 降 低 污染 、 
控制 疾病 传播 ,以 及 提高 公园 .公共 汽车 和 救护 车 等 公共 设施 的 利用 效率 。” 
我 们 肯定 数据 的 价值 .力量 和 重要 意义 ,正如 前 面 另外 的 章节 介绍 的 那样 ,但 
我 们 仍 会 看 到 个 人 隐私 信息 面临 的 潜在 泄露 风险 。 当 下 互联 网 作为 基础 设 
施 ,数据 在 终端 与 平台 之 间 、 服 务 与 公司 之 间 甚 至 国家 之 间 几 平 能 够 瞬间 转 
移 , 数 据 涉 及 的 用 户 众多 ,而 数据 收集 者 采用 的 方式 方法 透明 度 很 低 , 数 据 在 
流动 过 程 中 多 方 介入 缺乏 控制 力 ,更 不 用 说 数据 存在 被 买卖 的 情况 以 及 新 出 
现 的 以 数据 为 商品 的 交易 市 场 。 

亚 历 克 西 斯 。 马 德里 在 (大 西洋 月 刊 》 中 指出 :“ 当 今 你 的 简介 也 许 能 通 
过 一 分 钱 或 者 更 少 的 钱 来 买 到 ,谷歌 掌握 的 你 那 部 分 数据 价值 约 20 美元 ， 
Facebook 的 是 5 美元 等 等 ,但 一 个 用 户 对 于 互联 网 广告 业 的 价值 可 能 是 每 
年 1200 美元 。” 

对 于 数据 信息 越 来 越 高 的 使 用 价值 ,除了 通过 立法 明确 数据 保护 相关 政 
策 、 借 助 行业 标准 规范 行业 行为 来 维护 用 户 数据 的 所 有 权 和 使 用 权 外 ,也 需 
要 用 户 与 企业 的 积极 互动 。 不 少 人 在 安装 一 款 软件 后 ,都 被 询问 过 是 否 要 加 
入 “用 户 体验 改进 计划 ”。 然 而 多 数 用 户 并 不 明白 这 个 所 谓 的 用 户 体验 改进 
计划 意味 着 什么 ,即使 通读 了 说 明 获知 该 计划 的 目的 是 改善 服务 体验 ,用 户 
也 不 清楚 自己 要 为 这 项 计划 付出 什么 样 的 代价 。 事 实 上 ,在 我 们 点 击 确认 按 
钮 的 刹那 ,我 们 就 将 自己 的 相关 数据 发 送 和 反馈 给 了 那些 搜集 信息 的 软件 公 
司 , 这 不 能 算 作 是 与 用 户 的 沟通 。 而 这 样 的 事情 早 在 十 几 年 前 就 开始 了 。 
2003 年 9 月 ,微软 公司 针对 Windows 操作 系统 推出 的 办 公 套 装 软件 
Office 2003 就 启用 了 一 定 的 算法 ,把 用 户 在 真实 环境 下 使 用 软件 的 行为 数 
据 连 同 机 器 配置 等 信息 记录 一 并 通过 互联 网 发 回 到 公司 内 部 ,“ 用 户 体验 改 
进 计划 ”这 个 名 字 在 那 时 被 发 明 出 来 ,微软 公司 定义 这 个 项 目 代 号 为 SQM。 

麻 森 。 哈 里 斯 (Jensen Harris) 的 博客 记录 (MSDN. COM) 曾 显示 :“ 自 
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Office 2003 发 布 以 来 ,收集 的 使 用 片段 一 共有 13 亿 个 ,每 个 使 用 片段 都 记录 
了 某 个 固定 时 间 内 的 所 有 SQM 数据 ,连续 90 天 内 , 仅 Word 就 记录 了 超过 
3.5 亿 次 的 命令 行 点 击 .” 能 有 那么 多 用 户 在 真实 使 用 场景 下 提供 行为 数据 
是 有 些 令 人 吃惊 的 ,对 于 微软 这 样 大 的 一 家 软件 公司 ,当时 数据 多 到 有 些 收 
不 过 来 。 

有 些 时 候 , 伴 随 着 弹 框 提 示 我 们 也 能 看 到 “隐私 条 款 及 免责 声明 ”之 类 的 
字样 ,那些 具体 的 声明 信息 宛 长 且 难 以 理解 ,大 多 数 普 通用 户 根本 不 会 去 阅 
读 , 这 也 不 是 与 用 户 沟通 。 企 业 常常 因 担心 引发 谴责 ,与 用 户 使 用 不 同 的 语 
言 。 为 此 ,在 未 来 如 何 找到 一 种 简便 合适 的 沟通 方式 ,减少 企业 与 用 户 之 间 
相互 理解 的 障碍 是 非常 重要 的 。 

埃 里 克 。 西 格 尔 博士 作为 美国 预测 分 析 领 域 的 专家 ,在 解析 大 数据 预测 
工作 可 能 面临 的 问题 时 抱 有 这 样 的 担忧 :“ 各 家 公司 满足 于 继续 神秘 地 完成 
用 户 数据 搜集 ,因为 担心 引发 证 责 , 但 谴责 迟早 会 发 生 。” 他 还 认为 :“ 最 好 让 
人 们 现在 树立 意识 ,选择 该 分 享 什 么 ,不 该 分 享 什 么 ,以 及 如 何 、 在 哪里 进行 
分 享 。” 

对 于 用 户 来 说 , 还 以 Facebook 为 例 进行 估算 ,根据 上 面 提 到 的 
Facebook 掌握 每 个 用 户 的 信息 数据 每 年 能 带 来 5 美元 的 营 收 , 如 果 用 户 愿 
意 出 这 5 美元 ,就 可 能 让 Facebook 放弃 输出 自己 的 个 人 信息 ,如 果 用 户 愿意 
多 出 一 些 , 比 如 10 美元 ,就 可 能 得 到 Facebook 用 隐私 保护 算法 支持 的 安全 
服务 。 换 算 起 来 一 个 月 不 到 一 美元 的 费用 ,还 不 到 很 多 地 区 有 线 电 视 费 的 价 
格 , 却 对 保障 我 们 个 人 信息 隐私 有 很 大 益处 ,特别 是 给 像 Facebook 一 样 的 网 
络 服务 提供 商 传递 了 一 种 新 的 动力 , 即 他 们 可 以 在 研发 和 设计 网 络 应 用 的 时 
候 想 尽 办 法 多 支持 .更 好 地 配套 不 同 级 别 的 隐私 保护 安全 服务 ,向 用 户 提供 
个 人 信息 保护 成 本 和 安全 程度 的 多 种 选择 同样 可 以 获取 收益 。 毕 竟 使 用 隐 
私 保护 算法 也 会 有 一 定 的 技术 开销 。 
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当然 ,我 们 知道 ,不 论 是 Tails 匿名 系统 ,还 是 太 
是 差分 隐私 保护 算法 ,都 不 能 保证 隐私 的 绝对 安全 。 


匿名 .上 多 样 性 算法 甚至 
事实 上 ,这 个 世界 上 不 


存在 绝对 的 安全 。 但 是 ,隐私 并 不 是 一 场 零 和 游戏 ,算法 正在 用 一 种 更 为 公 
平 的 方式 , 重 塑 用 户 个 人 与 数据 公司 之 间 的 信任 与 合作 ,建立 数据 使 用 的 新 


秩序 。 
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美国 经 济 学 家 、. 诺 贝尔 经 济 学 奖 得 主 肯 尼斯 ， 约 登 夫 ' 阿 罗 认 为 :“ 信 
任 是 经 济 交换 的 润 请 剂 ,是 控制 契约 的 最 有 效 机 制 , 是 含 蔓 的 契约 ,是 不 容易 
买 到 的 独特 的 商品 “世界 上 很 多 国家 的 经 济 落后 都 可 以 通过 缺少 相互 信任 
来 解释 ”"。 的 确 如 此 ,如 果 和 人们 对 银行 失去 信任 ,就 会 发 生 抢 兑 ;如果 人 们 对 
股市 失去 信任 ,股市 就 会 朋 盘 ;如 果 人 们 对 国家 的 未 来 失去 信任 ,经 济 危 机 便 
会 迅速 爆发 。 信 任 是 社会 系统 和 经 济 系统 得 以 正常 运行 的 基石 。 越 是 发 达 
的 社会 ,人 们 彼此 间 的 信任 程度 越 高 。 

一 般 情 况 下 ,大 家 都 认为 最 值得 信任 的 机 构 一 定 是 政府 和 银行 。 银 行 成 
为 普通 百姓 储蓄 .理财 .贷款 等 金融 活动 的 最 主要 途径 ,因为 在 这 些 人 的 心目 
中 ,银行 是 由 权威 机 构 ( 如 政府 ) 设 立 的 ,甚至 可 以 说 ,只 要 国家 没有 灭亡 ,这 
种 信任 关系 就 是 坚实 可 靠 的 。 然 而 ,看 似 坚不可摧 的 金融 巨头 也 存在 破产 倒 
闭 的 风险 。 让 我 们 看 看 2008 年 的 美国 “次 贷 危 机 ”。 图 8. 1 详细 展示 了 美国 
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81 美国 次 贷 危 机 ” 


21 世纪 初 , 美 国 互 联网 泡沫 破裂 ,布什 政府 为 了 缓解 国内 经 济 萧条 的 局 
面 , 于 2000 一 2006 年 通过 美联储 降低 利率 、 提 升 减 税 幅度 等 相关 措施 推动 了 
美国 房地产 市 场 的 发 展 ,从 而 在 一 定 程度 上 缓解 了 美国 经 济 不 景气 的 局 面 。 
在 这 几 年 时 间 内 ,美国 房价 疯 涨 ,房地产 市 场 一 片 繁荣 ,进而 推动 了 放贷 机 构 
生意 的 火爆 ,但 由 于 竞争 加 剧 ,这 些 放贷 机 构 不 得 不 向 低 信用 的 居民 发 放贷 
款 , 并 向 投资 银行 出 售 资产 抵押 债券 从 而 获得 融资 ,这 使 得 投资 银行 、 保 险 公 
司 、 对 冲 基金 等 金融 机 构 赚 取 了 巨额 利润 。 但 好 景 不 长 ,美联储 两 年 内 17 次 
的 加 息 政策 使 得 房地产 市 场 逐渐 萧条 ,大 批 次 级 信用 贷款 者 无 法 偿还 贷款 ， 
大 量 违 约 现象 的 出 现 使 得 放贷 机 构 陷 入 危机 。 这 种 情况 下 ,投资 银行 出 现 巨 
额 亏损 ,保险 公司 、 对 冲 基 金 等 金融 机 构 因 资金 亏损 出 现 大 规模 倒闭 ,最 终 导 
致 市 场 前 盘 , 美 国 “ 次 贷 危 机 ”全 面 爆发 。 

普通 美国 人 成 了 这 场 灾 难 的 受害 者 ,他 们 一 直 被 他 们 所 信任 的 银行 及 金 
融 机 构 蒙 在 鼓 里 , 随 着 他 们 的 财富 所 剩 无 几 ,他们 的 信任 也 被 逐渐 瓦解 ,最 终 
导致 了 一 场 席卷 全 球 的 金融 危机 。 所 以 ,无 论 是 市 场 经 济 还 是 计划 经 济 , 首 
先 都 必须 是 法 制 经 济 .契约 经 济 ,也 是 信用 经 济 。 社 会 信任 是 推动 经 济 增长 


286 


第 8 章 信任 的 基础 一 区 块 链 


的 一 个 重要 因素 ,是 塑造 经 济 社会 的 先决 条 件 , 是 决定 经 济 增长 方式 和 企业 
组 织 形 式 的 关键 因素 。 建 立 起 符合 经 济 规范 的 社会 信任 体系 , 才 有 经 济 的 健 
康 可 持续 发 展 。 一 个 缺乏 信任 的 社会 将 加 剧 交易 难度 ,降低 经 济 运行 效率 ， 
同时 削弱 了 本 国 商品 的 市 场 竞争 力 , 优 质 产 品 难以 正常 销售 ,市场 鱼 龙 混杂 ， 
群众 对 任何 宣传 .广告 都 不 敢 轻 易 接受 ,从 而 令 经 济 进入 一 个 恶性 循环 。 

日 裔 美 籍 学 者 福山 所 著 的 《信任 : 社会 道德 与 繁荣 的 创造 > 一 书 深入 分 
析 了 社会 信任 程度 及 其 范围 对 经 济 组 织 形态 .产业 结构 .经 济 运行 效率 乃至 
国家 竞争 力 的 重大 意义 。 

福山 将 华人 社会 (包括 中 国 大 陆 ,香港 地 区 台湾 地 区 )、 意 大 利 、 法 国 、 韩 
国 这 4 个 低 信 任 度 的 代表 作为 一 类 ,在 这 些 国家 或 地 区 中 ,传统 文化 或 宗教 
崇尚 家 族 主 义 , 导 致 人 与 人 之 间 的 信任 程度 仅 限 于 家 庭 或 家 族 的 范围 内 ,对 
于 其 他 人 ,特别 是 陌生 人 基本 上 没有 信任 。 另 一 类 则 是 以 日 本 和 德国 为 代表 
的 以 非 血 缘 关 系 的 社团 为 基础 的 高 信任 度 国家 。 在 文化 和 历史 上 , 较 少 的 中 
央 集 权 历 史 、 家 族 力 量 的 相对 薄弱 与 中 间 社 会 连 属 关系 的 强大 ,促使 人 们 将 
信任 扩展 至 家 族 之 外 。 

在 经 济 组 织 的 过 程 中 , 低 信任 度 的 国家 或 地 区 呈现 出 大 量 的 小 型 家 族 企 
业 , 但 由 于 社会 普遍 信任 度 低 及 社会 资本 的 缺乏 ,企业 无 法 随 着 发 展 的 需要 
顺畅 地 迈 入 现代 专业 化 大 型 企业 阶段 ,加 之 家 族 的 财产 均 分 继承 制度 和 排斥 
外 人 经 营 ,企业 往往 富 不 过 三 代 。 为 了 发 展 大 型 企业 ,政府 只 能 积极 介入 , 扶 
持家 族 企 业 难 以 涉足 的 资本 密集 型 加 技术 密集 型 大 企业 ,这 些 大 企业 又 往往 
处 于 国家 竞争 中 居于 重要 地 位 的 产业 ,在 此 过 程 中 全 社会 都 不 得 不 承受 效率 
的 损失 与 资源 的 浪费 。 而 高 信任 度 的 国家 则 往往 更 顺利 地 从 家 族 小 企业 演 
变 为 现代 专业 化 管理 的 大 企业 。 

无 论 是 经 济 组 织 还 是 政治 组 织 形态 , 即 市 场 经 济 与 民主 政治 ,并 不 是 宏 
大 的 冷冰冰 的 固态 ,而 是 社会 中 每 个 人 行为 的 放大 与 集合 。 一 个 各 怀 鬼 胎 的 
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集体 一 定 比 不 上 一 个 团结 的 、 有 共同 价值 观 和 凝聚 力 的 集体 有 生产 力 、 有 效 
率 和 有 幸福 感 ,因此 社会 资本 与 信任 度 的 多 寡 直 接 影 响 到 宏观 经 济 行为 的 效 
率 。 在 高 信任 度 的 国家 可 以 产生 企业 集团 ,企业 间 以 互助 的 形式 和 道德 互惠 
的 传统 创造 高 绩效 ;而 在 低 信任 度 的 社会 ,为 了 堵 住 各 种 可 能 的 漏洞 ,不 得 不 
绞 尽 脑汁 将 契约 搞 得 很 长 ,不 得 不 常常 求助 于 正式 的 法 律 制度 (而 不 是 非 正 
式 的 道德 互惠 传统 ) 保 护 脆弱 的 .缺乏 安全 感 的 群体 。 这 些 不 信任 的 累加 , 致 
使 交易 成 本 无 形 上 升 ,最 后 结果 是 由 全 社会 的 成 员 共 同 买单 。 

显然 我 们 都 应 该 同意 福山 的 观点 ,中 国 确实 是 一 个 低 信任 度 的 国家 , 社 
会 和 经 济 系统 存在 的 漏洞 在 不 时 地 瓦解 人 们 之 间 的 互信 。 赛 博 经 济 越 是 飞 
速 发 展 , 就 越 需要 首先 解决 这 些 信 任 问 题 。 以 阿里 巴巴 这 样 的 电 商 平台 为 
例 , 它 能 够 让 商品 在 线 交易 ,首先 需要 建立 一 个 能 够 消除 买卖 双方 异地 交易 、 
随 生 人 交易 可 能 产生 的 风险 的 信任 平台 ,于 是 支付 宝 作为 第 三 方 支付 担保 乎 
台 就 产生 了 。 从 2003 年 支付 宝 首次 在 淘宝 上 推出 ,到 2015 年 “ 双 十 一 ”912 
亿 人 民 币 成 交 量 ,再 到 2016 年 单 日 进入 千 亿 元 ,背后 却 是 支付 宝 推动 阿里 生 
态 从 裂变 到 聚变 的 过 程 。 然 而 支付 安全 并 不 能 完全 保证 信任 ,淘宝 平台 的 信 
任 问 题 依 然 在 不 断 地 发 生 ,2015 年 1 月 至 9 月 ,支付 宝 系列 共 出 现 12 个 漏 
洞 ,平均 每 个 月 就 有 1. 3 个 漏洞 ;在 2017 年 的 “两 会 ”上 ,马可波罗 瓷砖 董事 
长 黄建平 表示 ,在 淘宝 上 有 300 多 家 马可波罗 的 店铺 销售 品牌 瓷砖 ,但 只 有 
两 家 店铺 获得 授权 ,其 余 都 是 侵权 的 假冒 伪劣 商品 。 虽 然 阿里 巴巴 董事 长 马 
云 一 直 强 调 要 “ 像 治 理 酒 驾 一 样 治理 假 货 ”, 但 这 并 不 能 避免 人 们 对 赛 博 经 济 
下 第 三 方 平台 的 安全 和 可 靠 性 的 怀疑 。 

无 论 是 政府 管辖 的 中 央 银 行 ,还 是 企业 设立 的 第 三 方 平台 ,它们 都 是 高 
度 依赖 中 心 化 处 理 的 金融 机 构 。 中 心 化 处 理 效率 高 ,成 本 可 控 ,但 是 一 旦 中 
心 出 现 问题 ,系统 将 迅速 崩溃 ,特别 是 当 人 们 对 中 心 产 生 信 任 危机 时 ,中心 化 
的 方案 就 会 遇 到 很 大 困难 。 
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经 历 过 一 系列 危机 后 ,人 们 可 能 都 会 有 这 样 的 疑问 : 我 存 入 银行 的 钱 现 
在 在 哪 ? 次 贷 危 机 的 悲剧 会 不 会 发 生 在 我 身上 ? 有 一 天 企业 如 果 倒 闭 了 ,我 
该 向 谁 要 这 笔 钱 ? 这 些 对 第 三 方 平台 及 银行 的 不 信任 也 在 促使 人 们 思考 ,是 
否 存在 一 种 不 依赖 中 心 化 的 信任 机 制 , 可 以 保证 上 述 经 济 运行 的 安全 可 靠 。 

诞生 于 “次 贷 危机 ?之 后 的 区 块 链 就 是 运用 去 中 心 化 思想 的 共识 机 制 , 实 
现 信 息 的 透明 化 与 公开 化 ,进而 令 重建 一 个 公开 透明 的 技术 监管 和 可 信 的 金 
融 系 统 成 为 可 能 。 以 “次 贷 危 机 ”为 例 , 其 发 生 的 诱因 是 住房 抵押 贷款 证 券 价 
值 大 为 贬值 ,人 们 原本 以 为 值钱 的 东西 突然 不 值钱 了 。 然 而 ,人 们 最 初 并 没 
有 对 某 些 商品 的 价值 达成 共识 ,而 是 将 这 些 商品 价值 的 评估 依赖 于 一 些 外 部 
条 件 ,比如 第 三 方 的 评估 。 反 之 ,倘若 所 有 人 都 对 某 一 商品 的 价值 达成 共识 ， 
那么 就 不 存在 商品 的 大 幅 贬 值 问题 。 区 块 链 就 为 我 们 提供 了 一 种 达成 这 种 
共识 的 基础 技术 。 


T 


拜占庭 将 军 问题 
这 座 城市 的 中 央 计 算 机 告诉 你 的 ? R2D2, 你 不 该 相信 一 台 陌 生 的 计 


算 机 ! 
一 一 C3PO 〇 ,星球 大 战 中 天 行者 阿 纳 金 制造 的 机 器 人 


如 何 才 能 让 我 信任 你 


自古 以 来 ,人 类 社会 里 许多 规则 的 设立 ,都 是 为 了 创造 一 个 信任 的 环境 ， 
解决 信任 问题 ,让 更 多 人 从 中 受益 ,大 到 一 个 国家 的 法 律 法 规 ,小 到 一 个 公司 
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的 制度 章程 。 然 而 ,尽管 人 类 在 不 断 完善 自己 的 社会 信任 体系 ,依然 难以 避 
免 那 些 在 特殊 情况 下 会 发 生 的 信任 危机 。 在 拜占庭 时 代 , 拜 占 庭 将 军 问 题 给 
了 人 们 一 个 启发 ,或 许 我 们 可 以 利用 逻辑 推理 和 数学 算法 去 解决 这 类 基于 在 
一 个 互 不 信任 的 分 布 式 群体 中 达成 信息 共识 的 难题 。 下 面 我 们 仔细 分 析 拜 
占 庭 将 军 问题 @ ,并 探寻 如 何 通过 算法 来 解决 这 个 问题 

在 很 久 以 前 的 拜占庭 时 代 , 有 一 个 繁荣 富强 、 兵 强 马 壮 的 国度 一 一 拜 占 

庭 , 它 的 帝王 把 整个 国家 治理 得 并 并 有 条 ,但 也 会 时 常 抢掠 周围 几 个 城邦 的 

富 (为 方便 描述 ,我 们 假设 周转 有 4 个 城邦 )。 而 作为 各 自 城邦 的 军事 领 
袖 , 将 军 A.B`C.D 实 在 忍 受 不 了 拜占庭 帝国 的 欺凌 ,但 在 庞大 的 拜占庭 面 
前 ,他 们 各 自 的 实力 实在 太 过 渺小 , 若 他 们 单独 进攻 ,犹如 “以 卵 击 石 ”。 经 过 
实力 对 比 ,他 们 各 自发 现 只 有 超过 半数 的 将 军 ( 即 至 少 3 位 将 军 ) 在 同一 时 间 
进攻 和 拜占庭 才能 取得 最 终 的 胜利 ,否则 他 们 各 自 国家 的 财富 也 会 被 “ 作 壁 上 
观 ” 的 城邦 抢 光 ,所 以 他 们 和 希望 能 够 联手 攻打 拜占庭 帝国 。 

但 是 问题 来 了 ,由 于 历史 遗留 原因 ,4 位 城邦 的 将 军 A、B、C.D 彼此 都 不 
信任 ,他 们 可 能 出 尔 反 尔 ,答应 了 出 兵 却 又 临时 变 卦 。 同 时 ,他 们 没有 一 个 盟 
主 来 统一 规划 他 们 的 出 兵 计 划 , 而 且 出 于 防止 被 支持 、 谋 杀 等 安全 因素 的 考 
虑 ,他 们 也 不 可 能 聚集 到 一 处 来 商讨 进攻 拜占庭 的 时 间 。 面 对 这 种 情况 ,4 
位 将 军 只 能 通过 各 自 的 信使 来 传达 进攻 时 间 信 息 。 例如, 将军 A 让 信使 向 
其 他 三 位 将 军 传达 “将 军 A 希望 进攻 时 间 是 上 午 9:00”, 将 军 BB 将 军 C 和 将 
军 D 也 在 同一 时 间 以 同样 的 方式 分 别 向 其 他 三 位 将 军 传 达 11:00、13:00、 
18:00 进攻 拜占庭 的 消息 。 为 了 达成 共识 ,每 位 将 军需 要 根据 收 到 的 消息 再 


[ 


@ 和 拜占庭 将 军 问题 是 图 灵 奖 获得 者 Lesile Lamport 于 1982 年 首先 提出 的 ,这 个 问题 的 
命名 是 Lamport 受 Dijkstra 哲学 家 吃饭 问题 的 启发 而 杜撰 的 ,他 认为 让 问题 有 历史 感 有 助 于 
其 被 公众 广泛 认 知 ,实际 效果 却 并 不 理想 ,直到 比特 币 诞 生 后 ,这 个 问题 才 被 公众 了 解 。 
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次 选择 一 个 进攻 时 间 ,并 在 同一 时 间 再 次 发 送 给 另外 三 位 将 军 。 由 于 每 一 位 
将 军 有 4 种 选择 ,所 以 4 位 将 军 选 择 的 进攻 时 间 共 有 256 种 的 可 能 情况 。 在 
这 些 情况 中 ,只 有 至 少 3 位 将 军 同时 达成 一 致 共识 时 才能 出 兵 拜 占 庭 , 而 这 
样 的 结果 有 64 种 ,也 就 是 4 位 将 军 每 次 仅 有 1/4 的 概率 达成 共识 ,而 且 随 着 
将 军 数量 的 增多 ,这 种 共识 的 达成 会 变 得 更 加 渺 茫 。 不 仅 如 此 ,4 位 将 军 互 
不 信任 ,他 们 之 中 可 能 有 一 人 背叛 他 人 ( 称 为 “叛徒 ”), 违 背 之 前 达成 的 攻占 
计划 多 作 壁 上 观 ” 等 待 他 人 兵 败 拜占庭 ,进而 “ 坐 收 渔 笃 之 利 ”。 在 这 种 情形 
下 ,如 何 让 4 位 将 军 更 加 容易 地 达成 共识 成 为 一 个 难题 ,这 就 是 所 谓 的 “ 拜 占 
庭 将 军 问题 "(图 8. 2) 。 


图 82 和 拜占庭 将 军 问题 示意 图 


在 讨论 “拜占庭 将 军 问 题 * 时 ,假设 消息 传递 过 程 准确 无 误 , 即 不 存在 消 
息 被 丢弃 、 消 息 章 自 改 等 情况 ,我 们 主要 关注 众多 将 军 中 是 否 有 叛徒 。 在 上 
面 的 例子 中 ,出 于 不 信任 的 关系 ,4 位 将 军 可 能 存在 叛徒 ,会 “临时 变 卦 ?或 
“ 假 传 圣 划 ”, 这 也 给 他 们 达成 共识 增加 了 难度 。 而 在 中 国 古代 ,破坏 彼此 共 
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识 的 事例 不 胜 枚 举 。 

春秋 战国 时 期 ,公元 前 630 年 , 因 郑 国 从 属 晋 国 的 敌人 楚 国 , 且 之 前 没有 
礼 待 晋 文公 , 晋 国联 合 盟友 秦 国 围攻 郑 国 , 在 这 千钧一发 之 际 , 秦 穆公 在 烛 之 
武 的 劝说 下 却 选择 退兵 ,因为 秦 国 害怕 晋 国 强大 之 后 会 危及 自己 的 疆土 ,这 
就 是 历史 上 有 名 的 “ 烛 之 武 退 秦 师 ”( 图 8. 3) 。 


图 83 烛 之 武 退 秦 师 


安史之乱 之 后 , 唐 朝 一 片 萧 条 ,公元 765 年 , 吐 著 联 合 回 丝 .吐谷浑 以 及 
山 由 等 30 万 军队 攻打 长 安 。 唐 朝 大 将 郭子仪 只 身 前 往 回 丝 阵 营 劝说 回 丝 首 
领 药 葛 罗 ,在 郭子仪 的 劝说 下 , 回 丝 与 唐 朝 结盟 ,并 联合 出 兵 吐 著 , 给 吐蕃 以 
沉重 的 打击 ,从 而 帮助 唐 朝 避 免 一 场 浩劫 。 

秦 国 和 回 丝 破坏 了 曾经 达成 的 共识 ,导致 了 原来 的 同盟 方 遭 受 重大 失 
败 。 因 此 让 共识 达成 一 致 且 不 被 破坏 ,成 为 “拜占庭 将 军 问题 "的 核心 内 容 。 

信任 这 类 问题 是 有 其 内 在 逻辑 的 ,首先 叛徒 希望 达到 以 下 目的 : (1) 坎 
骗 某 些 将 军 , 促 成 “在 某 个 时 间 发 兵 ” 的 虚假 共识 ;(2) 混 淆 菜 些 将 军 , 扰 乱 其 
他 将 军 达 成 共识 。 所 以 ,各 位 将 军 必 须 有 一 套 抗 干扰 的 机 制 ,才能 使 所 有 中 
诚 的 将 军 达 成 何 时 出 兵 拜 占 庭 的 共识 ,并 且 不 受 少数 叛徒 欺骗 和 混淆 的 
影响 。 
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经 过 推理 ,我 们 可 以 知道 当 叛 徒 的 数量 少 于 1/3 时 ,拜占庭 将 军 问题 ” 
可 以 解决 9: 举例 来 说 ,假设 只 有 将 军 C 一 个 人 是 叛徒 。 不 妨 站 在 将 军人 的 
角度 来 分 析 , 每 次 将 军 A 收 到 的 三 条 消息 里 有 两 条 消息 是 来 自 忠诚 的 将 军 BB 
和 将 军 D, 而 这 两 条 消息 是 正确 的 (可 靠 的 ); 另 外 一 条 消息 来 自 上 叛徒 将 军 C， 
而 这 条 消息 是 错误 的 (不 可 靠 的 )。 即 将 军 A 收 到 的 三 条 消息 里 ,有 两 条 消 
息 是 正确 的 ,一 条 消息 是 错误 的 。 

如 图 8.4 所 示 , 假 如 患 诚 的 将 军 B 和 将 军 D 都 想 “ 发 兵 ”, 而 叛徒 将 军 C 
见 机 不 妙 , 想 破坏 这 个 共识 ,所 以 故意 说 “ 撤 
退 ”。 但 将 军 A 收 到 的 “发兵 "消息 数量 要 多 于 
“撤退 ”消息 数量 ,所 以 他 也 决定 “发 兵 "。 这 样 ， 
即使 叛徒 将 军 C 最 终 选择 了 “撤退 ”, 因 为 有 将 
军 A, 将 军 B 和 将 军 D 攻占 拜占庭 ,这 样 也 会 取 
得 最 终 的 胜利 ,拜占庭 将 军 问 题 " 得 以 解决 。 

叛徒 数量 等 于 或 多 于 1/3 时 ,拜占庭 将 军 问 题 不 能 解决 : 假设 将 军 C 和 
将 军 D 两 个 人 都 是 叛徒 。 不 妨 站 在 将 军 A 的 角度 来 分 析 , 每 次 他 收 到 的 三 条 
消息 里 有 一 条 是 来 自 忠诚 的 将 军 B, 而 这 条 消息 是 正确 的 (可 靠 的 ); 另 外 两 条 
消息 则 来 自 叛徒 将 军 C 和 将 军 D, 而 这 两 条 消息 是 错误 的 (不 可 靠 的 ) 。 即 将 军 
A 收 到 的 三 条 消息 里 ,有 一 条 消息 是 正确 的 ,两 位 两 条 消息 是 错误 的 。 

如 图 8.5 所 示 , 假 如 忠诚 的 将 军 BB 想 “ 发 兵 ”, 而 叛徒 将 军 C 和 将 军 D 都 
故意 想 “ 促 成 ”这 个 共识 的 达成 ,因为 如 果 仅 有 将 军 A 和 将 军 B* 发 兵 ” 的 话 ， 
一 定 兵 败 和 拜占庭 ,这 样 他 们 两 个 城邦 的 财富 就 可 被 叛徒 将 军 C 和 将 军 D 抢 


图 84 叛徒 数量 少 于 13 


@ 细心 的 读者 可 能 觉得 叛徒 数量 不 多 于 1/2 就 可 以 ,这 个 问题 比较 复杂 ,一 个 简单 的 例 
子 是 当 三 个 将 军 中 有 一 个 叛徒 时 ,另外 两 个 人 是 无 法 判断 谁 是 叛徒 的 ,从 而 无 法 达成 一 致 。 感 
兴趣 的 读者 可 以 参考 1982 年 Lamport 的 文章 The Byzantine Generals Problem 。 
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走 , 所 以 两 个 叛徒 都 谎 称 自己 想 “ 发 兵 "。 这 样 
一 来 ,将 军 A 会 收 到 三 条 “发 兵 ” 消 息 , 他 会 义 
无 反 顾 地 “发 兵 ”。 而 最 终结 果 却 只 有 忠诚 的 
将 军 A 和 将 军 了 攻打 拜占庭, 他们 不 仅 战 败 ， 
而 且 自 己 的 财富 也 被 叛徒 将 军 C 和 将 军 D 抢 
劫 。 在 这 个 例子 中 ,因为 叛徒 数量 超过 一 定 界 图 85 叛徒 数量 多 于 13 

限 而 使 得 共识 问题 遭 到 破坏 ,在 这 种 情况 下 ， 
“拜占庭 将 军 问 题 " 不 可 解决 。 

从 上 面 的 分 析 可 知 ,在 同步 通信 环境 中 ,叛徒 个 数 小 于 将 军 总 数 的 1/3 
时 ,将军 们 可 以 达成 一 致命 令 。 如 果 同 步 通信 是 可 认证 、 防 自 改 的 ,任意 多 叛 
徒 都 可 以 有 解决 方案 。 而 如 果 异 步 通 信 时 ,只 要 有 一 个 叛徒 存在 “拜占庭 将 
军 问 题 ” 便 无 解 。 

“拜占庭 将 军 问 题 > 提 出 了 在 一 个 互 不 信任 的 分 布 式 网 络 系统 中 达成 可 
信 共 识 的 问题 ,然而 我 们 的 社会 跟 我 们 的 网 络 系统 一 样 , 远 比 这 复杂 。 如 果 
把 这 个 问题 放 到 我 们 的 网 络 系统 中 ,那么 叛徒 就 代表 网 络 异常 节点 , 当 异 常 
节点 较 少 或 出 现 的 概率 较 低 时 ,关于 “拜占庭 将 军 问题 ”的 讨论 才 有 意义 。 在 
计算 机 领域 ,管理 员 错 误 配置 、 误 操作 、 网 络 节点 遭受 黑客 或 病毒 攻击 、 系 统 
后 门 、 漏 洞 等 原因 都 可 以 导致 网 络 节点 异常 ,进而 使 得 整个 网 络 系统 不 可 信 ， 
这 也 给 网 络 系统 中 众多 节点 达成 共识 增加 了 难度 ,所 以 我 们 需要 进一步 解决 
在 不 可 信 的 网 络 环境 下 如 何 达成 共识 。 


你 不 可 能 通过 挑战 既定 事实 来 改变 一 件 事情 ,除非 建立 一 个 全 新 的 技术 
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并 废弃 现 有 机 制 。 
一 一 R.Buckminster Fuller, 美 国 建筑 师 、 作 家 ,设计 师 ,发 明 家 
为 了 解决 拜占庭 将 军 问 题 ,Lamport@ 和 Pease@ 等 学 者 均 提 出 了 各 自 
的 解决 方案 ,这 些 方案 有 一 个 共同 点 , 那 就 是 使 用 了 递归 算法 ,普通 读者 理解 
起 来 并 不 容易 。 清 华 大 学 姚 期 智 先生 (2000 年 图 灵 奖 获得 者 ) 的 学 生 王 君 行 
最 近 提 出 了 一 种 新 型 网 络 协 议 @, 用 简单 的 循环 蔡 代 了 复杂 的 递归 运算 , 算 
法 简单 直观 。 值 得 一 提 的 是 , 王 君 行 提出 这 种 解决 方案 的 时 候 还 是 一 名 大 一 
新 生 , 让 人 不 禁 感慨 “自古 英雄 出 少年 ”。 下 面 讲 述 一 下 这 个 精巧 算法 。 
假设 个 拜占庭 将 军 (Go ,G1，,…,G,-1) 中 有 tn 二 3) 个 叛徒 (是 的 ,叛徒 
数量 必须 已 知 ,Lamport 的 算法 也 一 样 ) ,每 位 将 军 的 消息 用 表示。 集合 A 
为 集合 {1,2,…,n 一 1} 的 子 集 ,其 数量 为 忠诚 将 军 的 数量 , 即 |A|=n 一 t。 一 
开始 ,Go 将 消息 广播 至 所 有 将 军 ,对 于 每 个 集合 A, 其 中 的 所 有 将 军 将 收 到 
来 自 Go 的 消息 7 以 自身 消息 7 广播 至 所 有 将 军 ,每 个 将 军 将 收 到 的 多 数 


1 Commander Go sends ro to all. 
2: for AC{1,2,.…,n—1}),|A|=n—tdo 
3: forieAdo 

4 Gi sends r; to all; 

5: end for 

6 forje{l,2,..…,n—1}do 

7 rj © majority(RjA) 

8: endfor 

9: end for 

10: Each Ci takes r; as his answer. 


图 86 简单 的 拜占庭 将 军 协议 算法 


® Lamport L, Shostak R, Pease M. The Byzantine Generals Problem [J]. ACM 
Transactions on Programming Languages and Systems (TOPLAS). 1982, 4(3): 382-401. 

©® Pease M, Shostak R. Lamport L. Reaching Agreement in the Presence of Faults[J]. 
Journal of the ACM (JACM). 1980, 27(2) : 228-234. 

® Wang]J. A Simple Byzantine Generals Protocol [J J. Journal of Combinatorial 
Optimization, 2014, 27(3): 541-544. 
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将 军 发 送 来 的 消息 视 为 自身 的 最 终 消息 。 这 样 , 当 算法 执行 完成 后 ,n 个 拜 
占 庭 将 军 就 Ge 发 送 的 消息 均 能 达成 共识 。 

为 了 便于 理解 上 述 算法 ,我 们 举例 说 明 , 假 设 在 一 个 网 络 中 存在 7 个 节 
点 : Go,G1，,… ,Gs ，, 且 Go 向 其 他 6 个 节点 发 送 消息 。 此 时 的 目标 是 让 所 有 的 
7 个 节点 能 够 达成 共识 , 即 收 到 的 消息 是 一 致 的 。 需 要 说 明 的 是 ,网 络 中 可 
能 存在 恶意 节点 。 当 存在 2 个 恶意 节点 时 ,不 妨 假设 C .Gs 为 恶意 节点 ,Go 
利用 广播 技术 向 其 他 6 个 节点 发 送 消息 “1”( 或 者 说 Ge 希望 消息 “1” 成 为 大 
家 的 共同 知识 )。 针 对 该 消息 ,从 剩余 7 一 1=6 个 节点 的 集合 中 选取 包含 
7 一 2 二 5 个 节点 的 子 集 , 这 样 的 子 集 共 有 6 个 ,如 图 8.7 所 示 。 对 于 集合 A 
的 任意 一 种 情况 ,可 靠 节 点 的 数量 总 是 大 于 恶意 节点 的 数量 ,所 以 每 次 循环 
的 结果 都 不 会 受到 恶意 节点 的 干扰 ,直至 集合 A 的 所 有 情况 都 被 执行 完毕 ， 
最 终 达 到 所 有 节点 的 共识 


i 


图 87 集合 A 的 所 有 情况 


需要 指出 的 是 ,算法 巧妙 利用 了 单调 性 ,也 就 是 说 一 旦 忠诚 的 节点 达成 
共识 ,该 共识 就 会 一 直 持 续 下 去 。 如 果 Ge 忠诚 ,那么 共识 一 直 持 续 (图 8. 7 
的 情况 )。 如 果 Go 不 忠诚 ,算法 会 侦 历 所 有 忠诚 节点 数量 的 子 集 , 则 也 一 
能 取 到 一 个 忠诚 节点 的 完整 集合 ,这 时 大 家 可 以 达成 共识 ,然后 持续 到 算法 
结束 。 要 注意 ,虽然 取 到 忠诚 节点 的 全 集 , 但 是 由 于 Go 不 忠诚 ,他 会 告诉 不 
同 的 节点 不 同 的 命令 ,但 是 由 于 忠诚 的 节点 会 忠实 的 交换 收 到 的 命令 ,所 以 
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最 终 仍然 可 以 达成 共识 。 

需要 注意 的 是 ,在 拜占庭 将 军 问题 中 ,只 有 叛徒 数量 少 于 三 分 之 一 的 将 
军 总 数 时 ,该 问题 才 可 解 。 具 体 证 明 可 以 参考 Lamport 的 论文 。 

2008 年 图 灵 奖 得 主 芭 芭 拉 … 利 斯 科 夫 2® 1999 年 在 论文 Practical 
Byzantine Fault Tolerance® 中 提出 了 一 种 实用 的 拜占庭 容错 系统 。 具 体 机 
制 如 下 : 

系统 中 的 节点 通过 选举 的 方式 选择 出 主 节点 (类 似 于 领导 选举 ) ,图 8. 8 
中 节点 0 为 节点 1、2,3 的 主 节点 ,其 中 节点 3 为 恶意 节点 。 当 客户 端 向 这 
节点 发 送 消息 时 ,首先 将 请 求 消息 发 送 至 主 节点 0(request 阶段 ) ,节点 0 将 
来 自 客户 端的 请 求 消 息 发 送 至 节点 1、2、3(pre-prepare 阶段 ), 这 三 个 节点 在 
收 到 来 自主 节点 0 的 请 求 后 ,会 通过 广播 的 形式 告诉 彼此 该 消息 是 什么 
《prepare 阶段 ) ,在 收 到 别人 的 “告知 ”后 ,每 个 节点 根据 多 数 节点 的 “告知 ” 决 
定 出 请 求 消息 的 内 容 ,并 执行 该 请 求 (commit 阶段 ) ,最 后 将 执行 结果 反馈 给 
客户 端 (reply 阶段 )。 虽 然 系 统 中 存在 恶意 节点 3, 但 这 并 不 会 影响 整个 系统 
对 客户 端 请 求 的 执行 。 

当然 ,并 不 是 所 有 选举 的 主 节点 都 是 可 信和 的 ,例如 图 8. 8 中 ,如 果 节 点 0 
为 恶意 节点 ,而 其 他 节点 为 可 信 节 点 时 ,各 个 节点 会 根据 由 主 节点 0 下 发 的 
消息 进行 判断 (也 是 通过 广播 的 形式 获得 其 他 节点 收 到 的 消息 ) ,如 果 主 节点 
0 不 可 信 , 则 该 系统 将 进行 重新 选举 主 节点 。 这 种 检查 与 选举 机 制 在 一 定 程 
度 上 保证 了 整个 系统 达成 的 每 个 共识 都 是 安全 可 信 的 。 


@ 芭 芭 拉 。 利 斯 科 夫 (1939 年 一 ) ,本 名 Barbara Jane Huberman。 美 国 计 算 机 科学 家 ， 
2008 年 图 灵 奖 得 主 ,2004 年 约翰 ， 冯 诺 依 曼 奖 得 主 。 美 国 工程 院 院 士 ,美国 艺术 与 科学 院 院 
士 ,ACM 会 士 ,现任 麻 省 理工 学 院 电 子 电气 与 计算 机 科学 系 教授 。 她 是 美国 第 一 个 计算 机 科 
学 女 博士 。 导 师 为 1971 年 图 灵 奖 得 主 约翰 。 麦卡锡。 

©® Castro M, Liskov B. Practical Byzantine fault tolerance [C]//OSDI. 1999, 99: 
173-186. 
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1 1 1 四 本 
request ! pre-prepare ! prepare ! commit ! reply 


主 节点 0 


图 88 实用 的 拜占庭 容错 系统 


共识 机 制 的 先驱 : P2P 


你 想 用 卖 糖 水 来 度 过 余生 ,还 是 想 要 一 个 机 会 来 改变 世界 ? 
一 一 1983 年 史 蒂 夫 。 乔 布 斯 对 当时 的 百事 可 乐 总 裁 约 翰 。 斯 卡 利 说 
拜占庭 将 军 协 议和 网 络 容错 技术 的 发 展 解决 了 信息 共识 问题 ,这 也 令 
P2P 通信 中 的 基本 问题 一 一 可 靠 通信 问题 得 到 解决 。P2P 网 络 让 人 们 实 
现 了 资源 的 共享 ,作为 P2P 技术 衍生 物 的 区 块 链 , 融 合 了 现 有 技术 , 它 从 诞 
生 到 现在 ,能 够 一 直 稳 定 运 行 ,与 其 采用 的 分 布 式 网 络 技术 一 一 P2P 技术 
不 无 关系 。P2P 技术 是 peer-to-peer( 对 等 网 络 ) 的 简称 ,是 一 种 计算 机 间 直 
接 通信 而 无 须 借 助 中 心 化 设备 来 共享 计算 机 资源 和 服务 的 分 布 式 技术 。 
它 没有 真正 意义 上 的 中 心 , 各 个 网 络 节点 直接 通信 、 相 互 协作 以 达到 资源 
共享 .服务 共享 的 目的 。 其 实 ,P2P 技术 对 于 我 们 来 说 并 不 陌生 ,PPLive、 
PPS 网 络 电视 `QQLive 以 及 曾经 饱 受 争议 的 “ 快 播 ?都 是 P2P 技术 的 典型 


应 用 。 
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彪炳 千古 的 P2P 


现代 生活 中 ,P2P 虽 不 是 一 项 新 的 技术 ,但 在 20 世纪 90 年 代 末 , 它 却 满 
足 了 数 以 千 万 的 用 户 对 网 络 资源 下 载 的 需求 ,以 至 于 迅速 风靡 全球。 同时 ， 
几 场 官司 也 使 得 P2P 成 为 互联 网 界 绯闻 缠身 的 “名 人 ”。 

1998 年 ,美国 东北 大 学 的 一 年 级 新 生 ,18 岁 的 肖 思 ，。 范 宁 (Shawn 
Fanning) 为 解决 会 友 “ 如 何在 网 上 寻找 音乐 "的 问题 ,开发 出 了 Napster 系 
统 , 成 为 P2P 技术 应 用 的 先锋 。Napster 将 所 有 音乐 文件 的 地 址 存放 到 一 个 
集中 的 服务 器 中 ,并 对 用 户 提供 音乐 检索 功能 ,这 样 用 户 就 能 方便 地 找到 所 
要 的 音乐 文件 。Napster 让 无 数 音乐 爱好 者 趋 之 若 务 ,被 认为 是 第 一 个 真正 
有 影响 力 的 P2P 软件 ,最 高 峰 时 有 8000 万 注册 用 户 。1999 年 ,Napster 公司 
成 立 , 它 能 够 提供 音乐 作品 上 传 . 检 索 和 下 载 的 功能 ,一 时 之 间 鞍 过 发 展 。 但 
好 景 不 长 ,美国 唱片 业 协 会 (RIAA) 起 诉 Napster 歌曲 侵权 ,败诉 后 的 
Napster 于 2002 年 宣告 破产 。 

一 个 Napster 倒 下 , 却 有 更 多 的 Napster 站 起 来 了 : 基于 P2P 技术 的 
Gnutella、Morpheus 和 KaZaA 等 公司 立即 填补 了 Napster 所 留 下 的 市 场 空 
白 并 加 以 发 扬 光 大 。 相 比 于 Napster, 这 些 公司 进行 了 改进 与 提升 ,在 避免 版 
权 控 诉 的 情况 下 ,使 得 P2P 技术 的 应 用 更 加 广泛 。 首 先 , 这 些 公司 接受 了 
Napster 的 教训 ,更 新 了 技术 , 避 开 了 采用 集中 服务 器 存储 用 户 文 件 信 息 (如 
音乐 文件 ) 的 做 法 ,所 有 的 信息 全 部 放 在 用 户 的 计算 机 上 ,它们 只 提供 P2P 
技术 ,至 于 用 户 做 什么 ,与 它们 没有 关系 ,从 而 很 好 地 躲 过 了 唱片 公司 对 音乐 
版 权 的 诉讼 ,也 为 P2P 技术 的 应 用 扫 清 了 最 大 的 障碍 ;其 次 ,这 些 公司 允许 
用 户 共 享 任何 类 型 的 文件 ,而 不 仅仅 是 MP3 类 型 的 音乐 文件 ,扩大 了 P2P 
技术 的 应 用 范围 ,有 力 地 推动 了 P2P 技术 的 发 展 。 
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P2P 技术 除了 应 用 于 文件 共享 领域 ,还 在 音频 通话 .视频 直播 和 视频 点 
播 等 流 媒体 领域 得 到 了 广泛 应 用 ,网 络 即时 语音 沟通 工具 Skype 利用 P2P 
技术 实现 语音 服务 ,CoolStreaming .PPLive 等 利用 P2P 技术 实现 视频 播放 ， 
Youtube、Youku 利用 P2P 技术 加 速 ,提升 了 用 户 视 频 播放 体验 。 


P2P 真正 解决 了 信任 难题 吗 


P2P 的 成 功 并 不 是 一 路 而 就 的 , 它 的 发 展 历经 好 几 代 , 新 发 现 的 问题 不 
断 由 下 一 代 来 解决 ,这 才 造 就 了 P2P 技术 如 今 的 成 功 。 即 便 如 此 ,P2P 网 络 
中 的 信任 问题 仍然 没有 被 完全 解决 。 

以 Napster 为 代表 的 第 一 代 P2P 系统 ,主要 采用 集中 索引 的 方式 来 处 理 
网 络 资源 的 共识 问题 。 中 央 目 录 服 务 器 为 各 个 网 络 客户 端 提供 资源 (如 音 
频 、 视 频 ) 检 索 服务 ,并 将 达成 的 共识 (如 资源 的 位 置 ) 返 回 给 P2P 节点 ,进而 
节点 间 直 接 进 行 通信 。 这 里 ,各 个 客户 端 主要 依赖 中 央 目 录 服 务 器 来 达成 某 
种 资源 共识 。 但 目录 服务 器 的 性 能 成 为 这 种 P2P 系统 的 瓶颈 。 同 时 ,第 一 
代 P2P 系统 通信 的 安全 .可 靠 性 必须 依赖 处 于 系统 中 心 的 目录 服务 器 ,这 也 
是 第 一 代 P2P 系统 在 共识 机 制 上 面临 的 主要 问题 。 

下 一 代 P2P 系统 吸取 了 经 验 教训 ,以 Gnutella、KaZaA 等 为 代表 的 第 二 
代 P2P 系统 是 一 种 完全 无 中 心 的 分 布 式 网 络 , 所 有 的 查询 和 响应 都 在 分 布 
式 的 P2P 节点 之 间 完 成 。 用 户 之 间 分 享 各 自 的 软件 .媒体 等 资源 不 再 需要 
经 过 中 心服 务 器 ,取而代之 的 是 以 广播 的 方式 散发 查询 消息 给 网 络 中 的 其 他 
用 户 , 具 有 较 好 的 容错 性 。 但 第 二 代 P2P 系统 在 解决 了 第 一 代 的 中 心 问题 
的 基础 上 引入 了 另外 一 个 问题 , 那 就 是 广播 流量 的 问题 。 在 资源 共识 达成 过 
程 中 ,需要 较 高 的 带宽 需求 以 满足 查询 请 求 在 网 络 中 的 广泛 传播 ,这 就 给 通 
信 .资源 共享 带 来 了 时 间 、 空 间 上 的 限制 。 在 资源 的 传播 过 程 中 ,虽然 避免 了 
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中 心 化 服务 器 的 安全 问题 , 却 没 有 改变 第 一 代 P2P 系统 信息 在 各 个 端点 处 
可 能 被 仿冒 、 自 改 等 安全 问题 。 

为 解决 这 些 问 题 ,第 三 代 P2P 系统 采用 分 布 式 哈 希 表 技术 @ 来 快速 查询 
网 络 中 的 文件 。 分 布 式 哈 希 表 将 资源 的 位 置 分 布 式 存储 在 整个 网 络 上 ,采用 
关键 字 和 对 应 的 值 一 一 对 应 的 表格 方式 存储 , 它 可 以 提供 与 哈 希 表 一 样 的 快 
速 查询 服务 。 

分 布 式 哈 希 表 允 许 大量 的 用 户 参 与 哈 希 表 的 维护 ,小 部 分 用 户 加 入 和 退 
出 对 整个 哈 希 表 整 体 影响 不 大 。 第 三 代 P2P 系统 以 Chord、CAN、Tapestry 
等 为 代表 ,同时 具备 前 两 代 P2P 结构 的 高 效 性 和 容错 性 优点 。 它 利用 位 于 
主干 位 置 的 超级 节点 ,而 不 是 像 第 一 代 那 样 只 依赖 于 中 心 化 的 服务 器 ,主干 
位 置 的 节点 不 再 是 单个 ,而 是 多 个 节点 共同 维护 整个 体系 结构 ,各 个 P2P 节 
点 通过 和 超级 节点 交互 以 达成 资源 共识 (如 获得 文件 信息 ) 并 进行 文件 传输 ， 
这 种 结构 对 现 有 的 网 络 具 有 更 好 的 适应 性 。 这 种 网 络 结构 能 够 达成 资源 共 
识 ,但 必须 要 求 每 个 节点 都 是 安全 可 信 的 ,如 果 其 中 一 个 节点 传播 错误 信息 ， 
就 会 使 得 整个 网 络 的 资源 共识 无 法 达成 。 

因此 ,如 果 P2P 技术 缺乏 对 节点 及 消息 的 可 靠 性 考虑 ,在 去 中 心 化 结构 
下 无 法 解决 形 如 消息 仿冒 , 算 改 等 安全 问题 ,就 不 能 实现 消息 济源 的 功能 ,而 
这 恰恰 限制 了 跟 货币 、 支 付 等 敏感 行业 相关 的 P2P 技术 的 发 展 。 

一 个 不 安全 的 P2P 网 络 是 无 法 获取 人 们 的 信任 的 。P2P 的 未 来 将 何 去 
何 从 呢 ? 就 在 P2P 技术 迷茫 之 际 ,比特 币 (Bitcoin) 诞 生 了 。 它 是 一 个 完全 
的 去 中 心 化 .去 信任 的 分 布 式 电子 账簿 系统 ,在 其 基础 之 上 的 交易 不 再 需要 


Q@ 哈 希 ,英文 Hash, 就 是 把 任意 长 度 的 输入 通过 哈 希 算法 ,变换 成 固定 长 度 的 输出 ,该 
输出 就 是 哈 希 值 ,也 称 为 散 列 值 。 这 种 转换 是 一 种 压缩 映射 ,也 就 是 , 散 列 值 的 空间 通常 远 小 
于 输入 的 空间 ,不 同 的 输入 可 能 会 散 列 成 相同 的 输出 ,所 以 不 可 能 从 散 列 值 来 唯一 的 确定 输入 
值 。 分 布 式 哈 希 指 的 是 哈 希 值 保存 在 网 络 中 的 不 同 节点 ,从 而 可 以 进行 分 布 式 的 查找 。 
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可 信 第 三 方 来 保证 ,人 与 人 之 间 的 信任 由 密码 学 的 机 制 来 保证 ,从 而 更 加 安 
全 。 可 以 说 ,比特 币 用 一 种 创新 的 方式 解决 了 拜占庭 将 军 问题 。 


区 块 链 的 鼻祖 : 比特 币 


我 们 需要 从 比特 币 革命 中 借鉴 经 验 , 但 比特 币 自身 还 不 够 完美 。 

一 一 比尔 。 盖 蒋 ,微软 公司 创始 人 

当下 ,比特 币 在 计算 机 及 金融 界 越 来 越 炙 手 可 热 , 而 如 此 火爆 的 比特 币 
年 纪 却 还 不 满 10 岁 。 

2008 年 11 月 ,中 本 聪 发 表 了 一 篇 名 为 4 比特 币 : 一 种 点 对 点 的 电子 货币 
系统 )(Bitcoin: A Peer-to-Peer Electronic Cash System) 的 论文 ,首次 将 比特 
币 技术 带 入 人 们 的 视野 。 次 年 1 月 , 首 个 比特 币 挖 矿 程序 发 布 , 世 界 上 最 早 
的 50 个 比特 币 诞生 。 而 当前 比特 币 的 规模 已 经 空前 庞大 ,市 值 也 已 经 超过 
了 900 亿美 元 ,那么 是 谁 缔造 了 如 此 庞大 的 比特 币 帝 国 昵 ? 

“中 本 聪 ?首次 出 现 是 在 2008 年 11 月 1 日 ,这 一 天 ,他 ”在 一 个 密码 学 
网 站 metzdowd. com 的 邮件 列表 中 发 表 了 比特 币 的 论文 ,首次 提出 了 比特 币 
的 概念 ;2009 年 ,全 球 首 款 比 特 币 算法 软件 出 现 , 随 后 的 短 短 几 年 时 间 里 , 比 
特 币 价格 疯狂 增长 ,也 令 其 他 的 数字 货币 黯然 失色 。 而 创始 人 “中 本 聪 ?的 身 
份 至 今 都 是 一 个 这 (图 8. 9) 。 

2013 年 5 月 ,计算 机 科学 家 泰 德 。 纳 尔 进 (Ted Nelson) 称 ,日 本 京都 大 
学 教授 望月 新 一 就 是 中 本 聪 。 从 他 的 学 术 成 就 来 看 ,比特 币 完全 有 可 能 出 自 
他 的 手 。 然 而 ,这 个 观点 也 引 来 一 片 质疑 。 而 望月 新 一 本 人 也 并 没有 回应 他 
到 底 是 不 是 中 本 聪 。 
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图 89 中 本 聪 是 谁 


2014 年 3 月 ,美国 (新 闻 周 刊 ) 一 篇 报道 声称 已 经 找到 中 本 聪 ,而 且 与 文 
章 作 者 进行 了 面谈 。 据 称 ,中 本 聪 现年 64 岁 , 又 名 多 利安 ,日 籍 美国 人 ,隐居 
在 洛杉矶 圣 贝 纳 迪 诺 山脚 下 的 一 座 房子 里 ,而 且 他 的 真实 姓名 就 是 中 本 聪 。 
当 被 问 及 比特 币 的 问题 时 ,他 说 :“ 我 不 再 参与 相关 事宜 ,不 能 再 讨论 该 问 
题 。 我 已 经 把 它 交 给 其 他 人 ,现在 由 他 们 负责 ,与 我 不 再 有 任何 关系 。 令 人 
大 跌眼镜 的 是 ,在 这 篇 报道 发 布 3 天 后 ,多 利安 却 又 否定 了 自己 是 中 本 聪 ,而 
神秘 的 中 本 聪 也 在 网 上 说 “多 力 安 不 是 我 ”。 

2015 年 12 月 ,美国 ( 连 线 》 和 Gizmodo 网 站 相继 发 表 文 章 ,认定 澳 大 利 
亚 商 人 兼 学 者 克 雷 格 。 史 蒂 芬 。 怀 特 (Craig Steven Wright) 就 是 中 本 聪 。 
Gizmodo 调查 发 现 , 在 比特 币 出 现 之 前 ,怀特 就 曾 在 电子 邮件 中 讨论 了 与 比 
特 币 有 关 的 工作 。 

由 于 中 本 聪 掌握 着 最 早产 生 的 100 万 个 比特 币 , 因 此 世人 对 中 本 聪 到 底 
是 谁 一 直 有 着 巨大 的 好 奇 心 。 到 底 怀 特 是 不 是 中 本 聪 ,没有 人 知道 ,或 许 中 
本 聪 是 谁 将 成 为 永远 的 秘密 。 然 而 不 管 怎样 ,相对 于 出 于 其 手 的 比特 币 来 
说 ,他 的 身份 似乎 已 经 不 再 重要 。 也 有 人 说 ,中 本 聪 已 经 不 可 能 出 现 了 ,因为 
他 的 出 现势 必 对 比特 币 的 市 值 带 来 巨大 冲击 ,这 种 情况 下 ,掌握 大 量 比特 币 
的 地 下 产业 不 会 允许 他 再 次 出 现 。 中 本 聪 最 明智 的 做 法 也 许 只 能 是 永远 隐 
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藏 自己 的 身份 。 


从 次 贷 危 机 到 比特 币 帝 国 


人 们 对 电子 货币 的 研究 比较 早 , 但 是 比特 币 却 直到 2008 年 才 诞 生 。 
2008 年 9 月 ,美国 次 贷 危机 全 面 爆发 ,这 不 得 不 迫使 人 们 对 现 有 的 货币 金融 
体系 产生 怀疑 ,比特 币 就 是 在 这 样 的 背景 之 下 诞生 的 。2009 年 比特 币 诞生 ， 
中 本 聪 在 其 中 写 道 :“The Times 03/Jan/2009 Chancellor on brink of second 
bailout for banks”( 此 处 用 原文 以 示 敬 意 ) , 带 着 对 旧 体 系 的 嘲讽 ,比特 币 真 
正 诞生 了 。 

2008 年 爆发 的 美国 次 贷 危 机 ,对 于 对 华尔街 和 政府 的 不 信任 ,人 们 开始 
寻找 一 种 能 够 完全 独立 于 政治 力量 和 金融 大 鳄 的 电子 货币 和 支付 方式 ;2008 
年 11 月 1 日 ,中 本 联 发 表 题 为 (比特 币 : 一 种 点 对 点 式 的 电子 货币 系统 ) 的 
论文 , 黄 定 了 比特 币 的 理论 基础 。 

2009 年 1 月 3 日 , 首 个 比特 币 挖 矿 程 序 正式 发 布 ,中 本 聪 第 一 个 运行 该 
程序 ,获得 世界 上 最 早 的 一 批 50 个 比特 币 ,被 称 为 上 帝 区 块 。 

2010 年 5 月 22 日 ,来 自 于 佛罗里达 的 程序 员 Laszlo Hanyecz 用 10 000 
个 比特 币 换 来 了 两 块 比萨 ;5 月 22 日 这 一 天 也 被 确定 为 “比特 币 比 萨 日 ";7 
月 16 日 ,经 过 为 期 5 天 的 10 倍 暴涨 ,比特 币 价 格 从 0. 008 美元 升值 0. 08 美 
元 ;11 月 6 日 ,比特 币 经 济 总 值 超过 100 万 美元 ,每 个 比特 币 兑 价格 达到 0.5 
美元 ;11 月 28 日 “维基 解密 ”事件 发 生 , 比 特 币 帮助 维基 解密 及 其 创始 人 阿 
桑 奇 度 过 危机 。 

2011 年 2 月 9 日 ,比特 币 价 格 首次 达到 1 美元 ,与 美元 等 价 。 此 后 几 个 
月 ,比特 币 先后 与 英镑 等 多 个 国家 货币 的 沈 换 交易 平台 开张 ;3 月 6 日 ,比特 
币 全 网 计算 速度 达 900GH/s, 但 很 快 又 下 跌 了 40% ,显卡 挖 矿 开始 流行 ;6 
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月 19 日 ,黑客 从 感染 木马 的 计算 机 上 盗用 了 用 户 的 MT. Gox 证 书 ,6 万 个 用 
户 数据 被 泄露 ,导致 875 万 美元 的 账户 受 影响 ,此 后 数 月 多 家 平台 被 黑 ， 
Bitconinica 平台 因 两 次 遭受 攻击 ,最 终 停 了 服务 。 

2012 年 3 月 1 日 ,服务 器 超级 管理 密码 泄漏 ,价值 228 845 美元 的 
46 703 个 比特 币 失窃 ,黑客 是 比特 币 世界 挥 之 不 去 的 焉 梦 ;9 月 27 日 ,比特 
币 基金 创立 ,此 时 一 个 比特 币 为 12. 46 美元 ;11 月 28 日 ,区 块 供应 量 首次 减 
半 调 整 ,从 之 前 每 10 分 钟 50 个 递减 至 25 个 ,同时 比特 币 发 行 量 已 经 达到 发 
行 总 量 2100 万 的 一 半 , 此 时 一 个 比特 币 为 12.4 美元 ;12 月 6 日 ,世界 首 家 官 
方 认可 的 比特 币 交易 所 一 一 法 国 比特 币 中 央 交 易 所 诞生 ,此 时 一 个 比特 币 为 
13. 69 美元 。 

2013 年 3 月 28 日 ,比特 币 总 市 值 超过 10 亿美 元 ,一 个 比特 币 均 价 为 92 
美元 ;4 月 10 日 ,比特 币 价 格 创下 历史 新 高 ,一 个 比特 币 为 266 美元 ;4 月 20 
日 ,四川 芦山 地 震 当天 , 李 医 来 在 bitcoin 官网 发 起 对 灾区 的 比特 币 捐赠 ,中 
国 过 基金 此 后 宣称 共计 收 到 捐赠 比特 币 233 个 ,市 值 22 万 人 民 币 ,此 时 比特 
币 价 格 理性 回落 ,一 个 比特 币 为 121 美元 ;8 月 9 日 ,德国 成 为 全 球 首 个 认可 
比特 币 的 国家 ;10 月 29 日 ,加 拿 大 启用 世界 首 台 比特 币 自动 提 款 机 ;11 月 29 
日 ,比特 币 价 格 达到 历史 上 的 新 高 ,一 个 比特 币 为 1242 美元 ,而 当天 的 黄金 
价格 是 每 瘟 司 1240 美元 。 至 此 ,比特 币 实现 了 从 0. 008 美元 到 1242 美元 三 
年 狂 涨 千 万 倍 的 伟大 壮举 。 

从 2014 年 到 2017 年 , 越 来 越 多 的 人 疯狂 追求 挖 矿 ,迷恋 比特 币 , 促 成 了 
比特 币 的 成 功 。 那 么 比特 币 作 为 一 种 电子 货币 ,是 如 何 解决 信任 .共识 问题 
从 而 被 大 家 认可 和 追捧 的 呢 ? 
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“比特 县 ”中 的 比特 币 


截止 到 2017 年 3 月 3 日 ,共有 16 195 638 个 比特 币 已 被 挖 出 ,根据 比特 
币 系 统 所 使 用 的 技术 机 制 ,系统 设 定 的 上 限 是 2100 万 个 比特 币 , 预 计 在 
2040 年 所 有 的 比特 币 将 全 部 被 挖 出 。 

话说 在 拜占庭 帝国 ,有 一 个 经 济 非常 发 达 的 “全 国 十 强 县 ”比特 县 。 但 有 
一 个 令 人 不 解 的 问题 : 比特 县 竟然 没有 一 家 银行 ! 原因 就 在 于 该 县 的 百姓 
全 部 利用 一 种 叫做 “比特 币 ” 的 电子 货币 进行 交易 ,比特 币 ?成 为 这 个 县 代 名 
词 , 也 是 比特 县 名 字 的 由 来 原因 。 

很 久 以 前 ,比特 县 的 百姓 都 是 用 “以 物 易 物 ”的 方式 进行 交易 ,比如 老 王 
家 用 一 袋 大 米 换 老 赵 家 一 只 母 鸡 , 李 大 妨 用 一 锥 蜂蜜 换 王 阿姨 半 和 公 冬 惠 , 但 
这 种 交易 方式 实在 太 不 方便 ,最 终 被 以 黄金 为 代表 的 实物 货币 所 取代 。 这 
时 ,人 们 就 可 以 从 家 里 拿 出 一 克 黄 金 购 买 与 之 等 价 的 商品 ,如 老 王 用 一 克 黄 
金 购 买 一 只 猪 用 来 过 年 ,但 好 景 不 长 ,频繁 交易 的 黄金 由 于 易 磨 损 、 故 意图 
积 、 开 采 难 度 大 等 原因 ,县 里 的 黄金 总 量 根本 无 法 满足 人 们 日 常生 活 交 易 的 

一 筹 莫 展 的 县 长 提出 一 种 解决 方案 : 人 们 将 家 里 的 黄金 或 值钱 物品 全 
部 到 县 政府 换取 纸币 ,这 种 纸币 上 有 县 长 的 印章 和 签名 ,人 们 可 以 通过 这 种 
纸币 进行 交易 ,一 时 间 , 人 们 欢呼 惟 跃 ,纷纷 对 这 位 县 长 的 聪明 才智 称 鞠 有 
加 。 就 这 样 经 历 了 十 多 年 ,比特 县 经 历 了 翻天 发 地 的 变化 ,一 跃 成 为 全 国 十 
强 县 。 

但 就 在 这 个 时 候 , 县 长 却 打 起 了 自己 的 小 算盘 ,他 用 自己 的 印章 和 签名 
制作 了 很 多 属于 自己 的 纸币 ,一 跃 成 为 比特 县 的 首富 ,更 将 一 部 分 纸币 分 发 
给 自己 的 亲朋 好 友 。 久 而 久之 ,人 们 发 现 ,自己 手中 的 钱 越 来 越 不 值钱 ,出 现 
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了 严重 的 贬值 。 经 过 调查 ,最 终 将 矛头 对 向 县 长 ,整个 县 瞬间 炸 开 了 锅 , 人 们 
纷纷 要 求 废 除 县 长 的 这 种 特权 。 

有 的 人 建议 成 立 县 政府 银行 ,统一 管理 纸币 的 沈 换 与 发 放 , 但 人 们 已 经 
丧失 了 对 政府 的 信任 ,也 更 加 排斥 这 种 集中 式 的 存储 机 构 , 谁 又 能 保证 银行 
不 会 乱 印 纸币 呢 ? 就 在 大 家 不 知 所 措 时 ,一 个 名 叫 中 本 聪 的 人 发 布 了 一 条 通 
告 , 声 称 设 计 了 一 种 去 中 心 化 的 分 布 式 电 子 货币 系统 一 一 比特 币 , 可 以 解决 
目前 出 现 的 问题 。 

中 本 聪 提出 的 比特 币 系 统 首先 将 所 有 交易 记录 写 入 账簿 并 进行 公开 ,而 
不 再 记录 每 个 人 的 账户 余额 。 交 易 记 录 包 括 付款 人 、 收 款 人 和 付款 金额 ,只 
要 通过 这 些 交 易 记 录 进 行 推算 ,就 能 获得 每 个 人 的 账户 余额 ,从 而 判断 交易 
能 否 顺 利 进行 。 与 此 同时 ,为 保护 个 人 隐私 ,每 个 人 不 会 使 用 姓名 等 真实 身 
份 ,而 是 使 用 一 串 能 够 唯一 标识 自己 的 字符 。 在 这 种 情况 下 ,每 个 人 都 有 一 
个 保密 印章 和 印章 扫描 器 ,在 每 笔 交 易 中 , 付 款 人 和 收 款 人 分 别 用 每 个 人 的 
标识 字符 表示 ,并 加 盖 付 款 人 的 印章 ,而 这 个 印记 不 能 肉眼 识别 ,只 能 通过 印 
章 扫描 器 才能 识别 。 接 下 来 ,中 本 聪 在 县 里 招 幕 矿 工 , 这 种 矿工 不 是 传统 的 
拿 着 工具 去 山上 采矿 的 矿工 ,而 是 每 天 在 家 里 花费 一 定时 间 完 成 比特 币 挖 矿 
工作 。 同 时 ,根据 矿工 的 挖 矿 贡献 大 小 ,矿工 能 够 获得 不 同 的 报酬 。 

中 本 聪 分 别 给 每 个 矿工 一 个 新 账本 ,根据 目前 县 中 每 个 人 手中 纸币 的 数 

量 ,为 每 个 人 分 配 相应 数量 的 比特 币 , 并 让 各 个 矿工 在 各 自 的 账本 上 记录 下 
这 个 初始 时 刻 系 统 为 每 个 人 分 配 的 比特 币 数量 ,付款 人 均 为 比特 币 系统 , 收 
款 人 分 别 是 每 个 人 的 保密 印章 对 应 的 字符 。 

接 下 来 ,中 本 聪 解释 了 支付 与 交易 的 过 程 , 以 老 王 付 给 老 刘 5 个 比特 币 
为 例 。 老 王 首先 向 老 刘 咨询 他 的 标识 字符 ,比如 是 0x01a8c3f6 ,同时 老 王 也 
有 自己 的 标识 字符 ,比如 是 0x2d3c6a89, 然后 老 王 写 一 张 单子 ,内 容 为 
“0x2d3c6a89 向 0x01a8c3f6 支付 5 个 比特 币 ”, 然 后 老 王 用 自己 的 保密 印章 
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后 交 给 老 刘 , 老 刘 在 拿 到 这 个 单子 后 ,用 自己 的 印章 扫描 器 扫描 单子 上 
的 印章 ,发 现 得 到 的 字符 与 付款 人 的 字符 是 一 致 的 , 均 为 0x2d3c6a89 , 老 刘 就 
确定 老 王 签署 了 这 个 单子 ,因为 没有 任何 一 个 人 可 以 仿造 其 他 人 的 


在 这 种 情况 下 ,一 个 关键 问题 就 是 老 王 的 账户 余额 是 否 足以 支付 5 个 比 
特 币 ,而 这 项 工作 主要 由 矿工 们 完成 , 即 所 有 的 矿工 都会 收 到 这 个 单子 ,他 们 
将 会 检查 各 自 手中 的 账本 以 确认 标识 字符 0x2d3c6a89 的 余额 是 否 还 有 5 个 
比特 币 。 每 个 矿工 会 将 收 到 的 交易 单 记录 在 各 自 账 本 的 一 页 纸 上 , 并 将 该 页 
纸 上 内 容 输入 至 哈 希 编码 器 中 ,得 到 一 个 256 位 的 二 进 制 数 作为 该 页 纸 的 唯 
一 标识 ,如 果 账 本 上 该 页 内 容 被 人 自 改 , 则 无 法 对 应 这 个 二 进 制 数 ,这 样 就 保 
证 了 内 容 的 安全 。 同 时 ,矿工 也 会 将 账本 上 前 一 页 的 标识 以 及 当前 时 间 值 也 
写 在 该 页 上 ,然后 将 前 一 页 的 标识 、 该 页 的 标识 .时间 值 和 一 个 随机 数 (如 
56789) 输 入 到 一 个 编号 生成 器 中 , 若 产生 的 标号 前 13 位 均 为 0, 则 说 明 编 号 
有 效 , 并 将 该 编号 写 到 账本 的 这 一 页 ,否则 ,调整 随机 数 继续 尝试 有 效 的 
编号 。 

当 一 个 矿工 率先 得 到 有 效 编号 时 ,他 会 将 这 页 账本 的 内 容 告 诉 所 有 其 他 
的 矿工 ,其 他 矿工 在 收 到 这 页 之 后 ,用 编号 生成 器 重新 计算 收 到 的 有 效 编号 ， 
验证 正确 后 将 收 到 的 这 页 账本 写 入 到 自己 的 账本 中 ,以 保持 所 有 矿工 账本 的 
一 致 性 。 所 有 矿工 更 新 完 自己 的 账本 后 ,都 会 向 老 刘 说 这 个 交易 单 是 合法 有 
效 的 , 老 刘 这 才 放 下 心 来 ,而 第 一 个 挖 到 矿 的 矿工 也 因此 得 到 50 个 比特 币 
(注意 ,这 个 数字 是 示例 性 的 ) 的 报酬 。 

中 本 聪 在 提出 不 依赖 集中 处 理 的 比特 币 概念 后 ,比特 县 的 人 民 开 始 慢 慢 
接受 并 实施 ,从 此 ,整个 县 再 也 没有 出 现 县 政府 等 中 央 机 构 投 机 倒 把 的 现象 ， 
而 比特 币 中 所 使 用 的 机 制 , 正 是 本 章 所 要 介绍 的 关键 技术 一 一 区 块 链 。 
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区 块 链 : 让 信任 成 为 一 种 社会 共识 


我 对 所 有 的 加 密 货 币 及 区 块 链 想 法 及 实验 充满 热情 ,但 我 认为 ,比特 币 
的 网 络 效应 ,很 可 能 是 持久 不 朽 的 。 

一 一 马克 。 安德森 ,硅谷 风险 投资 公司 Andreessen Horowitz 的 联合 创 
始 人 


华山 论 剑 : 比特 币 与 区 块 链 
区 块 链 (Blockchain) 与 比特 币 (Bitcoin) 并 不 是 同一 个 概念 ,前 者 是 一 项 


技术 ,后 者 是 一 个 系统 。 如 图 8. 10 所 示 , 比 特 币 是 区 块 链 技术 的 产物 ,区 块 
链 是 依赖 比特 币 的 普及 才 被 大 家 广 为 接受 的 , 正 是 因为 比特 币 , 区 块 链 在 互 


联网 .金融 界 的 重要 性 才 得 以 慢 慢 体现 。 当 然 ,区 块 链 技术 目前 被 数 百 种 的 
数字 货币 (如 莱特 币 、 点 点 币 等 ) 使 用 ,比特 币 只 是 其 中 之 一 。 可 以 用 TCP/IP 


比特 币 底层 区 块 链 


技术 
一 种 点 对 点 式 的 基于 密码 学 原理 的 
电子 现金 系统 分 布 式 共识 账本 技术 


是 ET 


成 区 块 链 是 依 冻 比特 币 
比特 币 是 基于 区 块 链 

技术 的 产物 ， 正 是 因 的 局 由 和 大家/ 从 
为 区 块 链 ， 比 将 币 才 
能 站 稳 脚 限 ， 得 以 志 


速 普及 发 展 互联 网 、 金融 界 的 重 


要 性 才 得 以 慢 慢 体现 


图 810 比特 币 与 区 块 链 
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协议 栈 和 互联 网 的 关系 进行 类 比 ,TCP/IP 是 一 套 协议 栈 , 而 互联 网 是 采用 
TCP/IP 协议 栈 的 实际 网 络 系统 。TCP/IP 就 好 比 区 块 链 , 互 联网 就 好 比比 
特 币 系统 。 

从 技术 核心 来 看 ,区 块 链 是 一 种 基于 密码 学 原理 的 分 布 式 共识 账本 技 
术 。 区 块 链 利 用 去 中 心 化 的 P2P 技术 实现 分 布 式 共 识 机 制 ,完全 摆脱 了 传 
统 的 集中 处 理 方式 ,在 保证 共识 机 制 的 同时 ,将 系统 的 安全 性 提升 到 了 一 个 
新 的 层次 。 它 诞生 于 第 三 代 P2P 网 络 之 上 ,解决 了 P2P 网 络 中 的 信任 和 共 
识 问题 

区 块 链 与 传统 的 P2P 网 络 一 样 都 具有 去 中 心 化 的 特性 。 从 字面 上 看 ， 
中 心 化 意味 着 信息 都 要 往 一 个 地 方 去 ,显然 ,如 果 这 个 中 心 出 现 了 问题 ,整个 
系统 就 会 受到 影响 ;而 去 中 心 化 是 指 系统 中 的 每 个 个 体 都 是 中 心 , 这 样 只 要 
有 节点 存在 ,就 像 中 心 化 系统 中 的 中 心 存 在 一 样 , 整 个 系统 都 可 以 继续 运行 。 
那么 区 块 链 的 去 中 心 化 程度 如 何 ? 从 最 初 的 比特 币 区 块 链 来 看 , 它 是 完全 分 
布 式 的 ,也 就 是 完全 去 中 心 化 的 。 

诞生 于 比特 币 的 区 块 链 技 术 并 不 局 限于 比特 币 区 块 链 的 形式 ,而 是 在 其 
基础 上 不 断 抽象 升华 ,更 新 换代 。 如 今 的 区 块 链 , 它 的 中 心 化 程度 可 以 是 弹 
性 的 ,就 如 同 当初 从 第 二 代 P2P 网 络 到 第 三 代 P2P 网 络 发 展 一 样 ,从 完全 的 
中 心 化 ,到 可 以 根据 不 同 的 使 用 场景 允许 不 同 程度 的 中 心 化 。 这 种 变化 使 得 
区 块 链 可 以 适应 纷繁 的 使 用 场景 ,我 们 可 以 根据 不 同 的 场景 ,弹性 配置 区 块 
链 , 从 而 在 性 能 .可 靠 性 和 安全 性 之 间 找 到 一 个 最 佳 的 平衡 点 。 
区 块 链 在 传统 P2P 网 络 的 基础 之 上 添加 了 许多 新 的 特性 。 首 先 它 是 
可 算 改 不 可 否认 的 。 建 立 在 传统 P2P 网 络 之 上 的 信息 交换 ,在 信息 经 过 中 
间 节 点 之 后 , 若 中 间 节 点 更 改 了 传递 的 信息 ,通信 双方 即使 可 以 通过 终端 用 

户 检查 发 现 , 也 无 法 确定 到 底 是 谁 从 中 作 梗 。 在 这 种 网 络 之 下 ,所 传递 信息 

的 可 靠 性 需要 靠 终 端 用 户 自己 来 保证 ,而 P2P 协议 本 身 可 能 并 不 提供 这 种 
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功能 ,这 就 给 用 户 带 来 了 麻烦 。 区 块 链 技术 将 信息 的 验证 融入 到 了 协议 之 
中 ,不 可 算 改 ,不 可 否认 成 为 了 协议 本 身 提供 的 基本 特性 ,这 大 大 简化 了 终端 
户 的 操作 ,同时 也 提升 了 整个 系统 的 鲁 棒 性 。 

另外 一 个 不 得 不 提 的 特性 是 区 块 链 的 公开 透明 性 。 区 块 链 是 完全 透明 
的 ,所 有 人 而 不 仅仅 是 参与 比特 币 区 块 链 构建 的 矿工 和 交易 者 ,都 可 以 看 到 
整个 比特 币 从 诞生 之 时 起 的 所 有 交易 信息 。 当 然 , 这 是 早期 公有 链 的 做 法 ， 
现在 ,区 块 链 已 不 仅仅 局 限于 早期 的 公有 链 形式 ,而 是 已 经 衍生 出 像 私 有 链 、 
联盟 链 这 样 的 其 他 种 类 。 这 些 不 同类 型 的 链 拥有 不 同 的 公开 透明 性 以 适应 
不 同 的 应 用 场景 。 

区 块 链 极 大 的 去 中 心 化 ,不 可 自 改 性 ,不 可 否认 性 .公开 透明 性 共同 促成 

了 区 块 链 作为 信任 基础 设施 的 可 行 性 ,解决 了 参与 者 之 间 的 共识 问题 。 那 么 
区 块 链 是 使 用 了 怎样 的 技术 手段 来 实现 上 述 这 些 特 性 的 呢 ? 


把 信任 留 给 自己 


当前 最 大 ,用 户 最 多 的 区 块 链 就 是 比特 币 区 块 链 了 ,我 们 通过 它 来 了 解 
一 下 区 块 链 算 法 是 如 何 解决 信任 问题 的 。 

我 们 知道 ,整个 网 络 系统 中 有 非常 多 的 用 户 ,他 们 之 间 存 在 非常 多 的 
交易 ,比如 张 三 向 李 四 转 账 50 元 , 李 四 给 王 五 发 10 块 钱 红包 等 等 。 在 传 
统 的 交易 方式 中 ,资金 流转 都 是 经 过 中 介 的 。 你 在 某 电 商 平 台 上 买 东 西 ， 
钱 要 先 打 到 某 电 商 的 账户 上 ,然后 在 你 确认 收 货 之 后 ,卖家 才能 从 某 电 商 
那里 得 到 货款 ,当然 最 终 解释 权 归 某 电 商 所 有 。 如 果 某 电 商 侵吞 了 你 这 笔 
钱 怎么 办 ? 你 可 以 说 银行 有 转账 记录 , 那 如 果 银 行 与 某 电 商 串 通 昵 ?你 开 
始 头痛 了 吧 ? 

与 传统 的 交易 不 同 的 是 ,区 块 链 中 的 每 一 笔 交 易 都 会 以 广播 的 形式 告知 
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全 网 的 所 有 用 户 , 这 些 交 易 利 用 密码 学 的 签名 技术 都 打上 了 交易 双方 的 签 
名 ,抵赖 不 掉 。 如 果 一 方 不 承认 两 者 发 生 了 交易 ,那么 就 可 以 向 人 民 群 众 求 
证 (发 送 请 求 到 全 网 看 看 大 家 的 记录 )。 

当 网 络 上 的 其 他 用 户 ( 节 点 ) 收 到 每 一 笔 交 易 记 录 后 ,首先 会 对 其 合法 性 
和 有 效 性 进行 检查 ,并 将 合法 的 数据 记录 保存 至 一 个 本 地 的 区 块 中 。 本 地 的 
区 块 在 达到 一 定 条 件 之 后 才 会 被 广播 到 全 网 , 才 有 可 能 成 为 全 网 共同 认可 的 
区 块 。 这 种 寻找 一 定 条 件 的 过 程 在 比特 币 的 系统 里 , 称 之 为 挖 矿 。 

随 着 用 户 间 交易 的 不 断 产生 ,本 地 区 块 中 可 能 包含 了 多 个 交易 记录 ,在 
某 一 刻 用 户 可 能 找到 了 那个 需要 达成 的 条 件 , 那 时 候 用 户 就 可 以 将 他 本 地 的 
区 块 广播 到 全 网 ,这 些 区 块 可 以 包含 全 网 用 户 在 一 定时 间 段 内 的 交易 。 比 特 
币 区 块 链 的 挖 矿 过 程 是 十 分 消耗 CPU 资源 的 ,需要 不 断 地 进行 大 量 计算 ,这 
也 是 人 们 从 密码 学 理论 上 认为 其 难以 被 修改 的 原因 ,是 构成 比特 币 区 块 链 信 
任 的 基础 。 在 区 块 被 广播 到 全 网 之 后 ,大 家 都 对 该 区 块 进 行 检查 。 由 于 标准 
的 检查 过 程 是 相同 的 ,就 像 国家 标准 一 样 , 达 到 了 就 是 达到 了 , 没 达到 就 是 没 
达到 ,只 要 区 块 是 有 效 的 ,那么 它 就 会 被 全 网 的 用 户 都 接受 ,这 就 是 共识 

聪明 的 读者 可 能 发 现 了 另外 一 个 问题 ,用 户 为 什么 愿意 做 这 种 为 人 民 
服务 的 事情 呢 ? 原因 很 简单 ,一 来 用 户 记 录 这 些 全 网 的 交易 是 要 收 税 的 
(交易 费用 ) ,二 来 既然 我 们 称 寻 找 达 成 某 个 条 件 的 过 程 为 挖 矿 , 自 然 就 可 
以 将 挖 到 的 “ 矿 ” 作 为 自己 的 收入 ,这 个 就 是 比特 币 。 全 网 所 有 矿工 在 收 到 
有 效 的 区 块 之 后 ,都 会 停止 在 当前 区 块 的 挖 矿工 作 ,因为 当前 的 矿 被 别人 
挖 走 了 。 在 将 这 个 区 块 追 加 到 上 一 个 区 块 的 尾部 之 后 ,矿工 们 又 在 最 新 区 
块 的 基础 上 开始 了 它们 新 的 挖 矿 之 旅 。 就 这 样 一 块 接着 一 块 就 形成 了 区 
块 链 。 

图 8. 11 描述 了 区 块 链 的 结构 ,每 个 区 块 中 含有 多 个 数据 记录 ,这 些 数据 
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记录 按照 一 定 的 组 织 形式 存在 于 区 块 之 中 ,而 这 些 数 据 记 录 的 哈 希 值 构成 能 


够 唯一 标识 区 块 的 ID。 每 个 区 块 会 记录 上 一 个 区 块 的 ID, 同时 又 将 区 块 生 
成 的 时 间作 为 时 间 戳 佬 入 到 区 块头 部 ,这 样 , 区 块 可 以 按照 顺序 链接 到 一 起 ， 
从 而 形成 区 块 链 。 
| L 
前 一 区 块 ID | | 当前 区 块 ID 前 一 区 块 ID | | 当前 区 块 ID 前 一 区 块 ID| | 当前 
寺 间 蕉 “| | 随机 数 时 间 难 “| | 随机 数 时 间 稚 | | 随机 数 
数据 记录 1 数据 记录 1 数据 记录 1 
数据 记录 M 数据 记录 N 数据 记录 O 


由 
能 出 现 分 叉 现 象 ( 如 图 8. 12 所 示 ), 即 在 同一 个 区 块 的 基础 上 产生 多 个 后 续 
区 块 ,这 一 方面 会 影响 区 块 链 的 稳定 性 , 男 一 方面 则 会 浪费 计算 资源 。 


3 


图 8 人 2 区 块 链 的 分 叉 现象 


在 


图 811 区 块 链 结构 


于 各 个 节点 是 分 布 式 并 行 工 作 的 ,因此 区 块 链 在 实际 运行 过 程 中 有 可 


区 块 链 中 ,共识 机 制 可 以 很 好 地 解决 分 又 现象 , 即 长 度 最 长 的 分 支 将 


分 支 ,并 纳入 到 区 块 链 的 主 链 中 。 这 样 ,在 区 块 产生 及 区 块 链 延 长 过 


程 中 的 小 分 支 将 会 淹没 在 历史 的 长 河中 ,这 有 利于 保证 区 块 链 数据 的 一 致 性 
和 安全 性 。 

区 块 中 保存 的 数据 记录 以 默 克 尔 树 的 形式 组 织 在 一 起 ,如 图 8. 13 所 示 ， 
所 有 的 数据 记录 存在 于 树 的 最 低 端 , 经 过 哈 希 计算 ,每 条 数据 记录 对 应 于 一 
个 哈 希 值 , 相 邻 哈 希 值 两 两 结合 形成 新 的 哈 希 值 ,就 这 样 由 底 向 上 ,当前 区 块 
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ID 就 是 所 有 交易 记录 的 最 终 哈 希 值 。 数 据 记 录 的 这 种 组 织 结构 有 利于 防止 
数据 信息 自 改 ,如 果 其 中 一 条 数据 记录 遭 到 恶意 修改 ,对 应 的 哈 希 值 也 会 发 


生变 化 ,并 最 终 使 得 当前 区 块 ID 发 生 更 改 , 而 被 更 改 的 区 块 在 其 他 用 户 那 里 


是 不 能 验证 通过 的 。 
区 块 
[前 一 区 块 ID ] [ 当前 区 块 ID | | 时间 稚 随机 数 
hash1234 
hash34 
hashl hash2 hash3 hash4 
数据 记录 ! | | 数据 记录 2 | | 数据 记录 3 | | 数据 记录 4 | 


图 813 区 块 的 结构 


区 块 中 的 数据 记录 如 图 8. 14 所 示 。 在 比特 币 中 ,数据 记录 的 表现 形式 


为 交易 (Transaction) , 它 利 用 密码 学 中 的 非 对 称 加 密 技术 来 保证 其 安全 。 在 
非 对 称 密码 学 中 有 两 个 密 钥 , 即 公 钥 和 私 钥 。 用 户 将 公 钥 发 布 给 其 他 人 ,而 
将 私 钥 秘 密 保 存 起 来 。 公 钥 加 密 技 术 提 供 两 个 基本 功能 : 加 密 和 签名 。 经 
公 钥 加 密 之 后 的 信息 只 有 私 钥 可 以 解密 ,由 于 私 钥 只 有 密 钥 产 生 者 知道 ,所 
以 其 他 人 不 能 破解 被 加 密 的 信息 。 而 私 钥 还 可 以 用 来 签名 ,其 他 任何 人 都 可 


以 用 该 私 钥 对 应 的 公 钥 来 验证 该 签名 ,由 于 私 钥 的 私密 性 及 唯一 1 


签名 就 像 人 们 常用 的 按 手 印 和 手动 签名 一 样 具有 不 可 抵赖 性 。 在 区 块 链 中 ， 


每 个 节点 都 有 一 对 公 钥 和 私 钥 。 以 比特 币 为 例 ,区 块 链 中 的 交 
图 8. 14 所 示 , 该 过 程 包含 交易 签名 和 交易 验证 两 部 分 。 
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交易 | 交易 交易 

用 六 1 的 公 届 用 户 2 的 公 角 户 3 的 公 钢 
| 1 | 
1 | 1 l 1 
哈 希 |] | 哈 希 |] ! 哈 希 
i i 

用 户 0 的 窒 名 用 户 1 的 签名 用 户 2 的 签名 

> a 
用 户 1 的 私 铀 | 用 户 2 的 私 铀 | 用 户 3 的 私 铀 


图 814 区 块 链 交易 示意 图 


假如 用 户 1 与 用 户 2 存在 某 种 交易 ( 即 图 中 的 交易 2) ,用户 1 首先 进行 
交易 签名 : 利用 用 户 2 的 公 钥 对 上 一 个 交易 ( 即 交 易 1) 进 行 哈 希 加 密 , 得 到 
哈 希 值 ; 然 后 用 自身 的 私 钥 和 该 哈 希 值 对 该 交易 (交易 2) 进 行 签名 ,并 将 该 
签名 嵌入 到 该 交易 中 ,最 后 将 该 交易 向 全 网 广播 。 全 网 节点 在 收 到 该 交易 
后 ,首先 进行 交易 验证 : 利用 用 户 2 的 公 钥 对 上 一 交易 (交易 1) 进 行 哈 希 加 
密 计算 得 到 哈 希 值 X; 利 用 用 户 1 的 公 钥 对 该 交易 (交易 2) 中 的 签名 进行 解 
密 , 得 到 解密 值 Y; 如 果 XX=Y, 则 证 明 当 前 交易 的 发 送 者 和 接收 者 确实 分 别 
是 用 户 1 和 用 户 2, 即 用 户 1 和 用 户 2 确实 要 进行 本 次 交易 。 经 过 交易 签名 
和 验证 后 ,当前 交易 才能 加 入 到 区 块 中 。 

相 比 传统 的 解决 方案 ,区 块 链 技 术 在 不 依赖 第 三 方 介入 的 情况 下 ,成 功 
地 解决 了 双 花 问题 Cdouble spending, 又 叫 双重 消费 )。 所 谓 的 双 花 问题 ,是 
指 一 个 用 户 在 账户 余额 有 限 的 情况 下 ,同时 向 两 个 或 以 上 的 人 支付 总 共 超过 
账户 余额 的 金额 。 依 赖 第 三 方 仲裁 该 用 户 的 余额 是 否 足以 支付 是 传统 的 解 
决 方案 ,而 区 块 链 中 通过 广播 每 一 笔 交易 以 及 在 交易 中 添加 时 间 截 更 好 地 解 
决 了 双 花 问题 。 
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聚焦 区 块 链 的 共识 


在 区 块 链 技 术 中 ,共识 机 制 是 实现 用 户 间 信 任 的 技术 核心 ,也 是 保证 全 


网 节点 就 区 块 信息 达成 一 致 共 识 的 关键 技术 。 在 共识 机 制 下 ， 


区 块 链 的 延长 


具有 一 致 性 ,区 块 信息 具有 安全 可 靠 性 。 如 图 8. 15 所 示 , 当 前 在 区 块 链 系统 
中 ,交易 记录 和 新 区 块 都 会 广播 至 全 网 ,使 之 成 为 全 网 节点 的 共同 知识 ,这 是 
区 块 链 共识 机 制 的 前 提 , 而 区 块 链 的 共识 机 制 主要 是 建立 在 工作 量 证 明 、 权 


益 证 明和 股份 授权 证 明 的 基础 之 上 的 。 


区 块 链 共 


识 机 制 


图 815 区 块 


工作 量 证 明 


链 共识 机 制 


工作 量 证 明 (proof of work,POW) 是 建立 在 以 下 两 个 问题 的 考量 上 : 一 


是 ,如 果 随 便 一 个 节点 在 短 时 间 内 都 能 将 新 区 块 加 入 到 区 块 链 中 并 广播 给 全 
网 , 那 区 块 链 岂 不 是 存在 太 多 的 分 又 ,以 至 于 短 时 间 
二 是 ,全 网 节点 为 什么 要 拼命 执行 这 套 机 制 ? 无 利 不 起 早 , 如 果 没 有 奖励 机 


制 , 谁 会 愿意 干 这 事 呢 ? 在 区 块 链 中 ,] 


[ 作 量 证 明 就 


内 根本 无 法 确定 主 分 


回答 了 这 两 个 问题 。 


支 ? 


首先 ,工作 量 证 明 使 得 每 个 节点 需要 付出 一 定 的 努力 和 代价 (如 CPU、 
硬盘 和 电量 等 ) 才 能 形成 新 区 块 ,并 链接 至 区 块 链 中 。 这 体现 了 节点 的 了] 
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,工作 量 越 大 , 越 有 可 能 形成 新 区 块 。 在 区 块 链 中 ,每 个 节点 通过 调整 区 块 
中 的 随机 数 , 并 利用 哈 希 计算 得 到 符合 条 件 的 工作 量 证 明 数 值 。 这 个 过 程 每 
个 节点 需要 不 断 尝 试 不 同 的 随机 数 ,而 寻找 合适 的 随机 数 完全 是 一 个 概率 事 
件 , 所 以 极 短 时 间 内 根本 无 法 完成 ,也 恰恰 由 于 这 个 原因 ,区 块 链 的 分 支 现象 
会 在 一 定 程度 上 减少 。 其 次 ,在 区 块 链 中 ,工作 量 证 明 也 是 一 种 激励 机 制 , 它 
会 对 生成 新 区 块 的 节点 ( 即 矿工 ) 给 予 一 定 奖励 ,在 这 一 定 程度 上 提高 了 矿工 
的 积极 性 。 

讲 到 这 里 ,让 我 们 再 重新 回顾 一 下 拜占庭 将 军 问 题 , 如 何在 一 个 互 不 信 
任 的 分 布 式 群体 中 达成 信息 共识 ? 

区 块 链 技术 通过 一 个 看 似 简单 的 办 法 解决 了 这 个 问题 , 它 为 发 送信 息 加 
入 了 成 本 ,目的 是 为 了 降低 信息 传递 的 速率 ,并 加 入 了 一 个 随机 元 素 以 保证 
在 一 个 时 间 里 只 有 一 个 将 军 可 以 进行 广播 。 

这 里 加 入 的 成 本 就 是 “工作 量 证 明 ”, 并 且 它 是 基于 计算 一 个 随机 哈 希 算 
法 的 。 以 比特 币 为 例 , 哈 希 算法 要 得 到 一 串 64 位 的 随机 数字 和 字母 的 字符 
串 ,就 像 这 样 

d70298566aa2fla66d892dc31fedce6147b5bf509e28d29627078d9a01a8f86b 

尽管 单个 哈 希 值 用 现在 的 计算 机 可 以 几乎 立刻 计算 出 来 ,但 只 有 前 13 
个 字符 是 0 的 哈 希 值 结 果 可 以 被 比特 币 系 统 接受 成 为 “工作 量 证 明 ”。 这 样 
一 个 13 个 0 的 哈 希 值 是 极其 罕见 的 ,大 致 需要 花费 整个 比特 币 网 络 10 分 钟 
的 时 间 来 找到 一 个 。 在 一 台 网络 中 的 机 器 随机 地 找到 一 个 有 效 哈 希 值 之 前 ， 
上 十 亿 个 的 无 效 值 会 被 计算 出 来 ,这 就 是 减 慢 信 息 传递 速率 并 使 得 整个 系统 
可 用 的 “工作 量 证 明 ”。 下 面 是 一 个 例子 : 
f51d0199c4a6d9f6da230b579d850698dff6f695b47d868cc1165c0ce74df5el 


d70298566aa2fla66d892dc31fedce6147b5bf509e28d29627078d9a01a8f86b 
119c506ceaal18a973a5dbcfbf23253bc970114edd1063bd1288fbba468dcb7f8 
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在 找到 一 个 有 效 值 之 前 ,成 百 万 甚至 上 亿 个 更 多 的 类 似 上 面 这 样 的 字符 
串 被 计算 出 来 ,直到 下 面 这 样 的 有 效 值 被 发 现 : 

000000000000084b6550604bf21ad8a955b945a0f78c3408c5002af3cdcc14f5 

那 台 发 现 新 的 有 效 哈 希 值 的 机 器 (或 者 说 是 拜占庭 问题 中 的 某 位 将 军 )， 
把 所 有 之 前 的 信息 放 到 一 起 , 附 上 它 自己 的 信息 以 及 它 的 签名 ,然后 向 网 络 
中 的 其 他 机 器 广播 。 只 要 其 他 机 器 接收 到 并 验证 通过 了 这 个 13 个 0 的 哈 希 
值 和 附着 在 上 面 的 信息 ,它们 就 会 停止 它们 当下 的 计算 ,使 用 新 的 信息 更 新 
它们 的 区 块 链 ,然后 把 新 更 新 的 区 块 链 作为 哈 希 算法 的 输入 ,再 次 开始 计算 
哈 希 值 。 哈 希 计算 竞赛 从 一 个 新 的 开始 点 重新 开始 。 如 此 这 般 , 网 络 持续 同 
步 着 ,所 有 网 络 上 的 计算 机 都 使 用 着 同一 版 本 的 总 账 。 

分 析 表 明 ,POW 共识 算法 其 实 是 一 种 概率 性 的 拜占庭 协议 ,在 不 诚实 节 
点 总 算 力 小 于 50% 的 情况 下 , 当 任 意 两 个 诚实 节点 的 本 地 链条 截取 K 个 节 
点 ,两 条 剩 下 的 链条 的 头 区 块 不 相同 的 概率 随 着 K 的 增加 指数 递减 ; 当 不 诚 
实 算 力 非常 小 时 ,才能 使 大 多 数 区 块 由 诚实 节点 提供 协议 的 正确 性 。 虽 然 工 
作 量 证 明 在 区 块 链 技术 中 意义 重大 ,但 它 是 以 计算 机 资源 和 能 量 的 消耗 为 代 
价 的 ,这 显然 是 一 种 浪费 。 同 时 ,如 果 某 个 节点 或 多 个 联合 节点 拥有 较 强 的 
算 力 , 它 ( 们 ) 甚 至 可 以 左右 整个 区 块 链 ,这 也 会 为 区 块 链 的 安全 埋 下 隐患 。 


权益 证 明 


由 工作 量 证 明 驱 动 的 区 块 链 技术 是 以 资源 与 能 源 的 巨大 浪费 为 代价 ,而 
权益 证 明 (proof of stake,POS) 解 决 了 这 个 问题 ,同时 又 不 会 影响 区 块 链 中 
的 激励 机 制 。 权 益 证 明 的 基本 思想 是 用 节点 的 权益 值 代替 工作 量 来 获取 记 
账 权利 并 获取 激励 收益 。 权 益 证 明 在 有 限 的 范围 内 尝试 随机 数 , 能 够 避免 资 
源 与 能 源 的 消耗 。 权 益 体 现 了 节点 对 特定 数量 数字 货币 的 所 有 权 , 用 币 天 
(coin days) 表 示 , 表 示 币 数 与 最 后 一 次 交易 的 时 间 长 度 的 乘积 。 在 解决 分 又 
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问题 上 ,区 块 链 选 择 消耗 最 高 币 天 的 分 支 作为 主 分 支 ,这 样 ,任何 一 个 试图 改 
变 分 支 的 一 个 或 多 个 节点 都 会 付出 更 多 的 币 天 为 代价 ,这样 的 难度 显然 是 更 
大 的 。 在 现 有 的 区 块 链 中 ,有 一 些 共识 机 制 是 采用 工作 量 证 明和 权益 证 明 结 
合 的 方式 ,这 样 在 达到 节约 资源 与 能 源 的 基础 上 ,又 把 强 算 力 节 点 联手 影响 
区 块 链 安全 的 问题 解决 了 。 


股份 授权 证 明 


股份 授权 证 明 (delegated proof of stake,DPOS) 是 权益 证 明 的 演化 机 制 ,类 
似 于 股份 公司 中 的 董事 长 选举 ,基本 思想 是 节点 拥有 的 权益 越 多 就 有 越 多 的 
投票 权 , 通 过 投票 选 出 得 票 最 多 的 前 100 个 代表 节点 ,每 个 节点 轮流 负责 生成 
区 块 ,并 将 一 定 比例 的 激励 平均 分 发 给 所 有 代表 节点 。 作 为 代表 节点 ,必须 保 
证 实时 在 线 , 为 大 家 提供 良好 的 区 块 生成 服务 ,否则 在 下 次 投票 选举 中 很 有 可 
能 丧失 代表 资格 。 这 种 方式 实现 节点 轮流 记 账 ,大 幅 减少 了 参与 验证 与 记 账 
的 节点 数量 ,在 实现 快速 共识 验证 的 同时 又 不 影响 区 块 链 数据 的 安全 性 。 


区 块 链 技术 : 带动 赛 博 经 济 进 和 智能 经 济 时 代 


近 几 年 ,包括 美国 .英国 中国、 俄罗斯 等 各 个 国家 纷纷 对 区 块 链 技术 作 
出 响应 ,对 本 国 区 块 链 的 未 来 作出 规划 。 

2014 年 ,美国 加 州 签署 法 案 , 将 使 用 比特 币 交 易 确认 为 合法 行为 ;2014 
年 底 , 美 联储 发 布 了 一 份 改善 支付 系统 的 白皮书 :“ 比 特 币 技术 目前 并 不 足 
够 成 熟 , 但 是 我 们 有 兴趣 进一步 探索 该 市 场 ”;2015 年 6 月 ,纽约 州 金融 服务 
局 公布 了 简称 为 “比特 币 牌 照 ”"(BitLicense) 的 《虚拟 货币 监管 法 案 ), 它 是 美 
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国 第 一 个 专门 为 虚拟 货币 量 身 打造 的 监管 规则 。 

2016 年 1 月 ,英国 央行 行 长 Mark Carney 发 表 题 为 (分 布 式 账本 技术 : 
超越 区 块 链 》 的 报告 ,体现 了 英国 对 区 块 链 技术 的 重视 ;同年 6 月 ,他 在 演讲 
中 展望 了 区 块 链 和 互联 网 金融 变革 全 球 人 金融 系统 和 英国 经 济 的 方式 ;7 月 20 
日 发 布 最 新 报告 指出 ,用 (英国 ) 央 行 发 行 的 数字 货币 替代 30% 流 通 中 的 货 
币 , 可 以 “把 GDP 提升 三 个 点 ,并 永久 保持 ”, 同 时 "大幅 改 善 央 行 稳定 商业 周 
期 的 能 力 ”。 

2016 年 10 月 ,俄罗斯 央行 开始 测试 基于 以 太 坊 的 区 块 链 原 型 一 一 
Masterchain;Tinkoff 银行 行 长 兼 首席 信息 官 Viacheslav Tsyganov 说 :“ 我 
们 与 合伙 人 一 起 开发 的 基础 设施 已 经 经 历 了 一 次 测试 ,证 明了 区 块 链 技 术 的 
最 大 潜力 ,及 在 搭建 银行 间 通 信 渠 道 的 适用 性 ”。 

2016 年 1 月 ,国际 货币 基金 组 织 发 表 《 虚 拟 货币 与 超越 : 初步 探讨 》, 益 
述 了 虚拟 货币 在 包括 支付 和 价值 转移 ,特别 是 跨 境 支付 和 价值 转移 方面 有 着 
非常 大 的 潜力 ,认为 能 够 在 推动 普 惠 金融 发 展 方面 发 挥 作 用 ,其 背后 的 技术 
所 引发 的 变革 将 远 远 超过 虚拟 货币 本 身 。 

2016 年 1 月 ,中 国人 民 银 行 对 区 块 链 等 数字 货币 技术 显示 出 了 高 度 肯 
定 , 首 次 将 发 行 数字 货币 作为 央行 的 战略 目标 ;12 月 27 日 ,国务 院 将 “区 块 
链 ” 写 入 “十 三 五 ”规划 ;2017 年 3 月 ,全 国人 大 代表 、 中 国人 民 银 行营 业 管 理 
部 主任 周 学 东 提 出 建议 : (1) 对 境内 比特 币 交 易 平台 应 当 包 容 、 暂 不 取缔 ; 
(2) 在 短期 内 必须 明确 比特 币 交 易 平台 监管 红线 ,严格 监管 ;(3) 建 立 负面 清 
单 ,做 好 风险 防范 和 化 解 工作 。 

在 赛 博 新 经 济 时 代 , 区 块 链 是 信任 的 基础 设施 ,是 信息 互联 网 到 价值 互 
联网 的 跳板 。 价 值 互联 网 是 指 人 们 在 互联 网 上 可 以 像 传递 信息 一 样 方便 快 
捷 地 传递 价值 ,例如 资金 。 在 价值 交换 中 ,安全 是 一 个 最 值得 关注 的 问题 ,而 
区 块 链 恰恰 可 以 让 两 个 互 不 信任 的 人 之 间 进 行 安全 可 靠 的 交易 。 作 为 信任 
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基础 设施 ,区 块 链 技术 将 令 未 来 互联 网 上 的 信息 与 价值 交换 ,不 再 必须 经 过 
第 三 方 的 介入 。 区 块 链 就 像 是 高 速 公 路 ,大 家 都 可 以 使 用 ,而 且 大 家 可 以 信 
任 它 ,不 必 担 心 它 的 安全 问题 。 同 时 在 无 中 介 的 情况 下 ,点 到 点 的 价值 交换 
将 节省 大 量 的 手续 费 ,更 加 方便 快捷 。 区 块 链 可 以 被 应 用 到 金融 、 物 联网 、 商 
业 、 安 全 ,信誉 系统 等 各 个 领域 ,其 未 来 是 不 可 估量 的 。 

随 着 人 工 智 能 的 发 展 ,智能 家 庭 ,智慧 城市 ,智能 交通 等 新 的 产品 及 商业 
形态 也 在 不 断 涌现 ,区 块 链 技术 也 加 速 了 这 样 一 个 万 物 互联 时 代 的 到 来 。 在 
区 块 链 基础 上 ,人 们 可 以 利用 智能 合约 构建 各 种 各 样 的 智能 系统 , 满足 不 同 
需求 。 智 能 合约 其 实 早 在 20 世纪 90 年 代 初期 就 被 提出 来 ,但 是 一 直 苦 于 没 
有 可 信 的 执行 环境 ,天 生 带 有 信任 特性 的 区 块 链 出 现 填补 了 这 一 缺口 ,使 得 
智能 合约 得 以 被 应 用 。 赛 博 新 经 济 时 代 也 将 在 利用 智能 合约 的 区 块 链 的 助 
力 之 下 , 迈 向 赛 博 智能 经 济 时 代 。 在 赛 博 智能 经 济 时 代 , 在 完全 没有 人 工 干 
预 的 情况 下 的 物 物 交易 将 成 为 一 个 非常 普遍 的 现象 ,人 们 将 从 烦琐 的 小 事 中 
解脱 出 来 ,例如 ,洗衣 液 使 用 完 后 ,洗衣 机 可 以 自动 购买 , 电 冰 箱 可 以 自动 购 
买 被 日 常 消耗 掉 的 水 果蔬 菜 等 。 

当然 ,区 块 链 想 要 发 展 ,仍然 需要 解决 一 些 问题 。 在 2016 年 Money 20/ 
20 会 议 上 ,以 太 坊 创始 人 Vitalik Buterin 就 曾 指出 :“ 那 些 声称 区 块 链 是 绝 
对 不 可 更 改 的 论断 实在 太 可 笑 了 。 因 为 事实 就 是 ,当时 只 要 你 有 4000 万 美 
元 ,你 就 能 对 以 太 坊 发 动 51% 攻 击 ”。 目 前 ,区 块 链 主要 在 可 扩展 性 和 安全 
性 以 及 隐私 泄露 .共识 算法 的 性 能 等 方面 依然 存在 挑战 。 

从 交易 频次 来 看 ,比特 币 区 块 链 每 秒 最 多 处 理 交易 次 数 的 极限 为 7 笔 。 
相 比 之 下 ,Visa 的 平均 速度 为 每 秒 5000 次 交易 ,峰值 大 约 每 秒 60 000 次 交 
易 , 支 付 宝 “ 双 十 一 ”的 峰值 为 每 秒 120 000 次 交易 。 不 仅 如 此 ,区 块 链 的 分 
布 式 特征 导致 其 流量 必须 广播 至 全 网 ,这 将 带 来 巨大 的 性 能 开销 和 资源 
浪费 。 
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同时 ,区 块 链 技 术 在 安全 性 方面 也 并 不 是 无 懈 可 击 ,攻击 者 的 计算 能 力 
超过 全 网 的 51% 就 可 能 操纵 整个 区 块 链 , 从 而 达到 自 改 交易 记录 截断 区 块 
链 正常 延伸 的 目的 。 虽 然 在 庞大 的 网 络 系统 中 ,拥有 51% 的 计算 能 力 或 控 
制 51% 的 节点 并 不 现实 ;有 分 析 显 示 , 这 种 方式 的 攻击 即使 会 成 功 ,也 要 花 
费 大 约 5000 万 美元 的 成 本 ,这 种 攻击 防御 的 不 对 称 性 破坏 了 攻击 者 的 意图 ， 
在 一 定 程度 上 保证 了 区 块 链 的 安全 。 

此 外 ,在 区 块 链 底层 技术 层面 , 非 对 称 加 密 技术 也 并 不 是 那么 牢 不 可 破 : 
2017 年 2 月 23 日 ,Google 在 其 安全 博客 上 公布 找到 了 世界 首 例 SHA1 碰 
撞 , 标 志 着 SHA1 不 再 安全 ;而 区 块 链 用 到 的 SHA256 技术 会 不 会 在 不 远 的 
将 来 被 破解 ?一旦 SHA256 被 攻破 ,比特 币 区 块 链 便 不 再 安全 。 再 如 ,区 块 
链 底 层 采 用 的 椭圆 曲线 加 密会 不 会 在 快速 发 展 的 量子 计算 机 面前 “漏洞 百 
出 ”? 这 些 都 将 成 为 区 块 链 的 安全 隐患 。 

未 来 , 当 智 能 合约 与 区 块 链 结合 ,一 方面 意味 着 方便 快捷 , 另 一 方面 也 使 
各 种 各 样 漏洞 的 利用 变 得 更 加 容易 。 以 2017 年 5 月 爆发 的 比特 币 勒 索 病毒 
为 例 , 攻 击 者 利用 Windows 系统 的 漏洞 来 入 侵 用 户 系统 ,对 用 户 的 文件 进行 
加 密 , 从 而 以 此 威胁 用 户 支付 比特 币 到 特定 账户 ( 即 利用 公 钥 生成 的 地 址 )。 
用 户 支 付 比特 币 之 后 ,受害 者 系统 中 的 病毒 通过 自动 扫描 区 块 链 来 检查 用 户 
是 否 支付 ,以 决定 是 否 恢复 被 加 密 的 文件 。 用 户 感染 病毒 后 的 加 密 、 勤 索 、 检 
测 的 过 程 都 是 自动 执行 的 ,不 需要 攻击 者 的 参与 ,这 很 好 地 隐藏 了 攻击 者 。 
即使 后 期 攻击 者 需要 交易 指定 账户 的 比特 币 ,在 其 有 所 防备 的 情况 下 ,攻击 
者 可 以 通过 许多 方法 ,比如 比特 币 的 混合 服务 使 得 对 特定 账户 的 追踪 变 得 极 
其 困难 ,这 就 导致 了 攻击 者 可 以 肆 无 忌 懂 进 行 勒 索 。 虽 然 这 并 不 是 比特 币 区 
天 链 本 身 的 安全 问题 ,但 从 一 个 侧面 反映 了 区 块 链 的 出 现 使 得 以 前 不 可 能 的 
攻击 方式 成 为 现实 。 就 像 新 事物 总 会 带 来 新 问题 一 样 , 如 何 处 理 好 区 块 链 带 
来 的 连锁 反应 ,也 势必 伴随 其 发 展 过 程 的 始终 。 
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算法 成 为 未 来 经 济 系统 演变 的 重要 推动 力量 ,人 类 正在 进入 一 切 丝 可 计 
算 的 时 代 。 在 算法 强大 的 力量 下 , 赛 博世 界 中 产生 的 海量 数据 和 信息 不 再 是 
一 团 乱 膝 ,算法 可 以 轻易 找到 隐藏 在 *“ 乱 麻 ” 中 的 “线头 ”, 让 这 些 数据 和 信息 
变 得 有 秩序 ,而 这 正 是 经 济 增长 的 基础 。 算 法 还 是 人 们 构筑 可 信任 机 制 的 基 
础 ,是 经 济 运行 安全 稳定 的 保证 ,不 仅 现在 ,还 包括 未 来 。 算 法 不 仅仅 是 社会 
经 济 运行 的 添加 剂 ,更 是 凌驾 其 上 ,定义 和 管控 着 整个 经 济 运行 过 程 ,形成 了 
当下 的 赛 博 新 经 济 ,并 推动 赛 博 新 经 济 朝 着 赛 博 智能 经 济 的 方向 发 展 。 如 果 
说 算法 重新 定义 了 今天 这 个 世界 的 经 济 秩序 ,那么 未 来 它 也 必然 会 开启 一 个 
赛 博 智能 经 济 的 黄金 时 代 。 
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赛 博 智能 经 济 的 雏形 


我 们 需要 万 分 警惕 人 工 智 能 ,它们 比 核武 器 更 加 危险 ! 
一 一 埃 隆 。 马 斯 克 , 企 业 家 
计算 机 科学 领域 的 专家 预测 2049 年 人 类 的 工作 生活 是 这 样 的 : 
人 人 都 是 程序 员 
“把 按钮 A 填 上 红色 , 放 在 左上 角 , 上 面 写 "注册 ”…'…” 黎 桐 对 着 手机 说 
道 ,注册 用 户 数量 暂 定 五 千 万 ,软件 名 称 叫 XX….…" 说 完 歼 桐 又 对 着 手机 屏 


幕 做 了 几 个 手势 。 如 果 这 段 对 话 发 生 在 今天 ,那么 最 可 能 的 场景 便 是 产品 经 
理 在 和 程序 员 在 沟通 。 但 这 段 对 话 发 生 在 2049 年 , 黎 桐 是 一 名 程序 员 , 准 确 
地 说 ,是 一 名 兼职 程序 员 。 她 并 不 是 在 跟 谁 说 话 , 而 是 在 一 个 人 编写 程序 。 
是 的 ,她 用 人 类 语言 描述 出 了 她 想 做 的 程序 ,完成 了 “ 源 代码 ”的 编写 。 然 后 
又 用 几 个 手势 摘 定 了 建立 数据 库 、 租 赁 服务 器 和 域名 等 操作 。 这 对 于 今天 的 
我 们 来 说 也 许 很 难 理解 ,一 个 不 懂 任 何 算法 、 数 据 库 和 服务 器 知识 的 人 ,是 如 
何 能 通过 几 身 话 、 几 个 动作 就 完成 了 一 套 可 执行 的 程序 ? 

在 2049 年 ,设计 师 在 写 程序 ,医生 在 写 程序 ,会 计 在 写 程序 ,作曲 家 也 在 
写 程序 …… 写 程序 不 再 是 外 行人 望尘莫及 的 复杂 工作 ,因为 到 了 那 时 ,人 人 
都 是 程序 员 。 程 序 的 编写 形式 也 将 变 得 多 样 性 : 人 们 可 以 写 程序 ,说 程序 ， 
务 程序 ……。 任何 一 个 有 需求 的 人 都 可 以 直接 与 计算 机 沟通 ,创造 自己 想 要 的 
程序 ,让 计算 机 为 自己 做 事 。 每 个 人 都 可 以 像 用 计算 机 写 一 段 文档 一 样 简单 
地 让 它 为 自己 创造 想 要 的 产品 和 服务 。 


324 


第 9 章 未 来 : 赛 博 智能 经 济 


智能 的 人 联网 

从 你 睡 醒 睁 开 双 眼 的 那 一 刻 , 你 已 经 生活 在 一 个 智能 机 器 人 充斥 的 环境 
中 : 你 的 家 本 身 就 是 一 个 智能 机 器 人 ,智能 卫浴 会 为 你 自动 调整 洗浴 水 温 ， 
智能 厨房 会 为 你 自动 京 饪 早餐 ,出 门 上 班 时 ,交通 工具 会 是 无 人 驾驶 的 机 器 
人 汽车 , 当 你 走 进 办 公 室 ,你 的 智能 桌子 会 立刻 感应 到 ,然后 为 你 打开 邮箱 和 
一 天 的 工作 日 程 表 。 在 一 个 人 物 联 网 的 时 代 里 ,你 的 手表 、 项 链 、 戒 指 . 眼 镜 ， 
洗衣 机 、 冰 箱 等 一 切 都 是 智能 化 ,它们 不 需要 人 的 介入 就 能 准确 运行 ,算法 真 
正 地 实现 了 物 的 自主 “思维 ”, 也 就 是 说 ,新 算法 的 产生 和 实现 不 需要 人 类 的 
干预 ,由 控制 算法 根据 设 定 的 规则 自主 决策 。 

相 比 未 来 的 赛 博 智 能 经 济 , 目 前 的 赛 博 新 经 济 可 以 说 只 是 这 一 切 的 纵 
形 。 之 所 以 如 此 ,是 因为 现在 算法 仍然 是 由 人 类 设计 和 实现 的 。 人 类 由 于 自 
身 知识 结构 和 认 知 能 力 的 局 限 , 在 理解 和 认识 我 们 的 物质 世界 时 是 不 全 面 
的 ,还 存在 不 少 模糊 不 清楚 的 地 带 。 况 且 , 人 类 一 直 是 在 用 世界 上 已 经 存在 
的 东西 来 帮助 我 们 理解 这 个 世界 ,这 仿佛 是 一 个 悖 论 。 人 类 的 数学 家 、 计 算 
机 科学 家 在 设计 算法 时 ,往往 需要 模型 的 帮助 。 模 型 是 人 类 对 真实 事物 或 现 
象 的 形式 化 描述 。 不 幸 的 是 ,在 这 样 的 描述 过 程 中 ,由 于 人 类 的 大 脑 能 够 处 
理 的 信息 量 也 是 有 限 的 ,最 终 构建 的 模型 往往 是 对 真实 世界 的 简化 。 例 如 ， 
最 简单 的 线性 一 元 一 次 方程 对 大 部 分 人 来 说 不 是 什么 难事 ,但 随 着 未 知 量 数 
量 的 增加 ,并 且 变 量 之 间 的 关系 是 非 线 性 的 时 候 , 人 们 往往 会 束手无策 。《 增 
长 的 本 质 ) 一 书 中 曾 提 出 过 一 个 叫做 “人 比 ”(personbyte) 的 度量 单位 ,这 个 
单位 的 含义 是 ,“ 一 个 人 的 神经 系统 所 能 接收 的 最 大 信息 量 ”。 基 于 这 个 概 
念 ,一 个 人 只 能 积累 一 个 人 比 的 信息 ,如 果 他 /她 试图 获取 的 信息 超过 一 个 人 
比 , 则 需要 其 他 人 的 协助 。 人 比 这 个 概念 说 明了 人 们 积累 知识 的 容量 和 能 力 
是 有 限 的 。 再 回 到 上 面 模型 的 例子 ,人 们 在 理解 事物 或 现象 时 ,如 果 所 需 的 
信息 小 于 一 个 人 比 ,就 可 以 充分 认识 该 事物 或 现象 。 不 过 ,我 们 身 处 的 世界 
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又 是 复杂 的 ,认识 其 中 的 事物 或 现象 所 需 的 信息 往往 会 超过 人 比 的 限制 ,这 
时 ,人 们 往往 不 得 已 采用 简化 处 理 的 办 法 ,而 这 正 是 人 类 对 世界 的 认识 和 理 
解 出 现 偏差 的 根源 。 

人 们 的 认 知 能 力 受 本 身 生物 属性 的 限制 ,在 有 限 能 力 的 情况 下 设计 实现 
的 算法 ,不 一 定 是 错误 的 ,但 一 定 存在 改进 和 优化 的 空间 。 此 外 ,目前 的 算法 
存在 一 个 最 大 的 软肋 一 一 缺乏 自主 性 。 当 前 的 算法 是 人 类 设计 和 实现 的 , 算 
法 的 处 理 流程 和 所 谓 的 “智能 其实 都 是 人 类 思维 的 衍生 ,从 本 质 上 来 说 ,并 
没有 摆脱 人 类 的 局 限 性 。 可 以 说 , 现 阶段 的 初级 算法 ,只 能 应 对 社会 经 济 这 
个 巨型 复杂 系统 中 很 小 的 一 部 分 。 即 使 这 样 ,现代 经 济 依然 在 算法 的 推动 下 
进入 了 赛 博 新 经 济 时 代 , 同 时 展现 出 了 巨大 潜力 ,也 为 未 来 的 智能 经 济 时 代 
带 来 了 无 限 的 想象 空间 。 

从 微软 公司 的 小 娜 小 冰 和 苹果 公司 的 Siri, 到 2016 年 战胜 韩国 棋 手 李 
世 石 的 围棋 程序 AlphaGo, 都 展露 出 未 来 智能 算法 强大 能 力 的 一 角 。2017 
年 5 月 底 ,围棋 人 机 大 战 第 二 季 在 浙江 乌镇 开始 。 大 战 之 前 ,人 们 都 很 期 待 ， 
这 次 AlphaGo 会 下 出 怎样 的 围棋 ? Google 会 不 会 派出 号 称 “ 从 不 接触 人 类 
的 棋谱 ,完全 靠 自 主 训练 成 长 ”的 版 本 ? 这样 一 个 “纯净 的 完全 没 受 过 人 类 污 
染 的 ”AlphaGo, 能 否 完全 颠覆 人 类 的 围棋 理论 和 认 知 ? 最 终结 果 很 具 冲 击 
力 ,AlphaGo 以 3 : 0 的 战绩 零 封 人 类 顶尖 高 手 柯 洁 , 其 中 很 多 手 棋 都 让 众 高 
手 叹为观止 。 

据说 ,去 年 战胜 李 世 石 的 是 AlphaGo 的 v18 版 本 ; 另 一 个 名 为 Master 的 
v25 版 本 已 经 在 网 上 连 胜 了 人 类 60 局 ,其 学 习 成 长 的 速度 再 次 引爆 人 类 的 
眼球 。 在 这 些 对 局 中 ,Master 已 经 下 出 很 多 让 人 类 棋 手 看 不 懂 的 招式 ,而 且 
越 来 越 多 的 人 开始 模仿 和 学 习 Master 的 某 些 套路 。 还 以 柯 洁 为 例 , 虽 然 不 
政 AlphaGo, 但 经 此 一 役 , 柯 洁 脱胎 换 骨 ,截至 2017 年 7 月 17 日 , 柯 洁 已 经 
对 人 类 选手 取得 了 22 连 胜 ,彻底 坐 稳 了 一 “ 狗 ” 之 下 ,万 人 之 上 的 宝座 。 
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下 面 来 看 看 AlphaGo 曾经 用 过 的 几 个 “ 奇 招 ”0, 从 中 可 以 体会 算法 的 


招式 一 : 

图 9.1 展 示 的 是 李 世 石 与 AlphaGo 第 二 盘 对 局 的 初始 阶段 。 这 里 ， 
AlphaGo 执 黑 在 棋盘 右 下 角 的 托 退 定式 还 没有 完成 就 开始 脱 先 , 到 上 边 拆 边 
构成 了 “中 国 流 ”。 李 世 石 执 白 在 左边 星 位 夹击 后 , 黑 棋 走 了 图 中 外 所 示 的 
尖 。 在 传统 理论 中 ,这 手 棋 可 以 说 是 绝对 先 手 , 很 多 职业 棋 手 都 会 选择 稳 一 
稳 , 到 最 好 的 时 机 再 下 这 一 手 , 以 免 早早 浪费 一 个 动 材 。“ 保 留 " 也 是 区 分 棋 
力 高 低 的 一 个 传统 方式 。 然 而 ,自从 AlphaGo 走出 这 招 以 后 ,人 们 很 快 就 认 
可 了 ,觉得 这 是 简单 明快 定型 ,以 免 将 来 走 不 到 这 个 先 手 。 


图 91 简洁 明快 的 听 ” 


招式 二 : 
图 9.2 展 示 的 是 第 一 次 人 机 大 战 时 ,AlphaGo 最 令 人 难忘 的 一 手 , 即 图 
中 的 急 。 这 一 步 出 乎 所 有 人 意料 ,完全 不 属于 人 类 围棋 思维 , 极 具 视觉 冲击 


@ 腾讯 体育 : http: //sports. qq. com/a/20170426/007550. htm。 
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力 。 在 右边 完成 几 手 交换 后 ,AlphaGo 粘 住 左边 的 两 颗 子 ,然后 在 人 类 认为 
绝 无 可 能 占 到 便宜 的 地 方 主动 开战 ,最 后 大 获 成 功 。 


92 极 富 冲击 力 的 一 手 


招式 三 ， 
图 9.3 展示 的 是 Master 执 黑 对 阵 中 国 棋 手 檀 哺 的 序 盘 。 其 中 黑 11 的 
“ 刺 ”, 只 在 围棋 大 师 吴 清 源 的 棋谱 中 出 现 过 。 赵 治 勋 曾 评价 这 手 棋 是 “简明 


图 93 与 吴清源 心灵 相通 的 一 手 


328 


第 9 章 ， 未 来 : 赛 博 智能 经 济 


快速 的 棋 风 ,喜欢 不 容 分 说 的 转换 ”"。 在 吴 大 师 之 后 ,还 没有 棋 手 敢 走 这 一 
手 ,直到 Master 出 现 。 难 道 说 实 买 中 Master 与 大 师 心 灵 相 通 ? 

从 AlphaGo 在 这 几 次 对 局 中 的 表现 看 ,人 工 智能 在 飞速 发 展 ,其 进化 的 
速度 远 远 超过 了 和 人们 的 估计 ,在 智能 化 的 道路 上 不 断 前 行 。 


人 类 无 法 理解 算法 带 来 的 新 知识 


不 是 我 创造 的 ,我 就 不 能 理解 。 

一 一 理 查 德 。 费 曼 , 物 理学 家 

2008 年 《 连 线 ) 杂 志 前 总 编辑 .无 人 机 公司 3D Robotics 首席 执行 官 克 
里 斯 . 安德森 (Chris Anderson) 写 下 了 这 样 一 段 话 :“ 海 量 数据 的 可 用 性 ,以 
及 用 来 分 析 这 些 数据 的 统计 工具 ,提供 了 一 种 认识 世界 的 新 方式 。 相 关 性 取 
代 因 果 关 系 ,即便 没有 一 致 的 模型 .统一 的 理论 或 者 任何 机 械 论 解释 ,科学 也 
能 够 前 进 ,” 这 段 话 当时 在 学 术 界 引发 了 广泛 而 激烈 的 争论 。 有 学 者 在 某 分 
子 生 物 学 期 刊 上 发 表 文 章 回应 :“…… 如 果 我 们 停止 去 寻找 模型 和 假说 , 那 
我 们 所 做 的 还 是 科学 吗 ? 答案 显然 应 该 是 “不 ?。” 

到 如 今 ,这 段 争论 已 经 过 去 9 年 ,当年 的 争议 在 今天 看 来 结论 已 经 显 而 
易 见 。 在 全 球 网 络 化 ,以 及 强大 的 计算 机 硬件 的 助力 下 ,计算 机 算法 取得 了 
飞速 的 发 展 , 已 经 使 得 计算 机 能 够 不 用 模型 就 能 运作 。 不 仅 如 此 ,计算 机 算 
法 还 能 够 自己 生成 模型 ,人 们 需要 做 的 仅仅 是 给 它 提供 数据 ,尽管 那些 模型 
看 起 来 难以 理解 ,不 太 像 人 类 构造 出 来 的 。 但 在 当下 这 个 “人 工 智 能 和 机 器 
学 习 ” 重 新 掀起 新 浪潮 的 时 代 , 这 样 的 情况 正在 变 得 越 来 越 普遍 。 

我 们 举 算法 构造 模型 的 例子 。 基 因 表达 式 编程 GEP (Gene Expression 
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Programming) 是 借鉴 生物 遗传 基因 的 结构 和 表达 规律 提出 的 一 种 自 适 应 演 
化 算法 。GEP 中 用 字符 串 表 示 染 色 体 , 这 些 字 符 串 代表 数学 表达 式 , 可 以 解 
码 为 表达 树 。 比 如 ,染色 体 “sqrt * 十 x* ax sqrtabc/1-cd” 就 代表 图 9.4 中 展 
示 的 数学 表达 式 及 其 表达 树 人。 


sqrt 
! 
es 
Eo | 
AN | 
必 / 
(atbe)a f 人 人 
AAS 
5 d 


图 94 染色 体 代表 的 数学 式 及 其 表达 树 

GEP 的 计算 过 程 就 是 这 些 代 表 “ 染 色 体 ”的 字符 串 仿照 自然 界 中 生物 进 
化 过 程 , 采 用 选择 .变异 .交叉 等 操作 算 子 ,使 染色 体 开 始 一 代 代 向 前 进化 ,也 
就 是 其 代表 的 数学 式 发 生 了 变化 ,直到 得 到 满足 要 求 的 结果 。GEP 算法 的 
应 用 范围 很 广 , 曾 被 用 于 预测 空气 的 PM2. 5 浓度 @。 在 这 个 课题 里 ,研究 者 
选择 了 7 个 相关 参考 变量 ,如 温度 .相对 湿度 .风速 ,风向 等 ,选用 的 运算 符 包 
括 十 .一 `X、 二 \sin\cos 等 12 种 ,初始 的 染色 体 种 群 数量 为 100, 每 个 基因 的 
头 部 长 度 为 10, 基 因数 目 为 6。 经 过 120 代 的 进化 后 ,得 到 的 染色 体 如 下 : 


*/C3 +sinXa -log* CosXeXsCAXSXX XXaCeX Xs + 
sqrt*/Xs +*cossinXaX XCCSXAX CXXAXsCoXe +* + 
XssinX*X icosXsexpCAX XCoXACAXCAXAXA, +Sqrt/ 
FX +—K /KsCoX XaCeX XsCX XCet++—cos*log/sin* — 
XXXSCAXACoXeCAXAXCs +*expX» +/*sin 一 
XKAICAAAOXKXXKICs 


@ 唐 常 杰 , et al.“ 基 于 基因 表达 式 编程 的 知识 发 现 一 一 沿革 , 成果 和 发 展 方向 . ”计算 
机 应 用 24. 10 (2004) : 7-10。 

回 刘 小 生 , 李 胜 , 赵 相 博 .“ 基 于 基因 表达 式 编程 的 PM2. 5 浓度 预测 模型 研究 . ”江西 
理工 大 学 学 报 34.5 (2013) : 1-5。 
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该 染色 体 对 应 的 数学 式 为 


y=-0.232 055* [X,-0.232 055* Xs -cosXs]/sin 
(logXo) +sqrt[Xs* (cosX3+sin(-0.576 05))/(Xa*X)]+[sin 
(Xi*cosX)) +X)*Xs +tsqrt [(X1+0.269 745*X)* (Xs 
0.650 543—Xs)/Xy] + [-0.266 113 * Xs * sinXs -log 
(0.336 273—Xs) + cos (XYX)] + Xx*exp [(sinX)/ 
(0.824 242—Xs)+X3* Xa] 


使 用 算法 自行 计算 出 来 的 结果 ,对 空气 中 PM2. 5 浓度 进行 预测 的 结果 ， 
准确 度 明显 高 于 其 他 预测 模型 ,预测 精度 非常 高 

GEP 算法 可 不 是 就 能 预测 一 下 PM2. 5 浓度 这 么 简单 ,对 于 时 间 序 列 的 
数据 ,如 气象 地震 、 太 阳 黑 子 等 ,甚至 对 于 股票 价格 ,都 有 很 好 的 预测 效果 。 
此 外 ,在 因 式 分 解 .谓词 关联 规则 挖掘 、 微 分 方程 求解 等 很 多 方面 都 有 丰富 的 
应 用 。 不 知道 大 家 有 没有 注意 到 这 样 一 个 事实 ,算法 自行 推导 出 的 结果 ,对 
我 们 来 说 ,往往 难以 理解 ,也 很 难 给 出 一 个 直观 的 解释 (比如 上 面 的 PM2.5 
浓度 预测 的 式 子 )。 这 是 不 是 可 以 理解 为 算法 (或 机 器 ) 的 思维 与 人 类 不 同 ? 
人 们 正在 逐渐 依靠 能 够 自行 推演 出 模型 (结果 ) 的 算法 和 机 器 ,但 这 些 模型 却 
超出 人 类 的 理解 范畴 ,以 一 种 异 于 人 类 的 方式 来 思考 ”这 个 世界 。 

人 类 在 认识 世界 的 时 候 , 往 往 需要 借助 模型 的 帮助 。 模 型 ,是 对 于 真实 
世界 中 的 事物 、 现 象 \ 过 程 或 系统 的 简化 描述 ,或 是 其 部 分 属性 的 模仿 。 如 果 
需要 了 解 和 认识 的 客体 较为 复杂 ,超过 了 人 类 处 理 能 力 的 限度 ,那么 人 们 常 
常 采用 的 方法 是 ,忽略 或 简化 那些 他 们 自己 认为 不 重要 的 、 影 响 轻微 的 因素 ， 
主要 考虑 那些 具有 明显 影响 的 因素 :还 不 行 的 话 , 则 对 客体 进行 分 解 或 割裂 ， 
化 整 为 零 , 分 别 进 行 考 虑 。 通 过 这 样 的 处 理 , 就 可 以 对 客体 构建 实体 模型 ,或 
是 抽象 的 数学 模型 ,进而 对 客体 建立 起 直观 、 深 刻 的 认识 。 通 过 模型 来 认识 
客体 ,是 一 种 可 行 的 办 法 。 然 而 ,通过 简化 或 分 解 处 理 得 到 的 模型 ,是 否 还 能 
准确 反映 真实 的 客观 世界 ? 


Nm 
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人 类 历史 中 出 现 过 很 多 有 名 的 模型 ,例如 在 战争 中 经 常用 到 的 沙盘 模 
型 ,金融 机 构 中 的 各 种 借贷 模型 .马尔 可 夫 模 型 ,还 有 小 朋友 玩 的 乐高 模型 等 
等 。BackChannel 网 站 在 一 篇 著名 的 文章 中 列举 了 两 个 经 典 的 例子 来 说 明 
人 类 构建 的 模型 中 可 能 隐 含 的 问题 了 。 

密西西比 河 是 北美 大 陆 水 量 最 大 、 流 域 面 积 最 广 的 河流 ,滋润 着 美国 
41% 的 土地 。1943 年 ,二 战 还 未 结束 ,出 于 治理 需要 ,美国 陆军 工程 兵部 队 
打造 了 一 个 200 英亩 大 的 密西西比 河 及 沿岸 土地 的 模型 ,这 个 超级 模型 用 来 
进行 各 种 模拟 实验 ,以 便 人 们 了 解 , 如 果 发 生 水 患 ,沿岸 的 城镇 会 面临 什么 状 
况 。 得 益 于 充分 的 研究 和 准备 ,奥马 哈市 才 安 然 度 过 1952 年 出 现 的 洪灾 , 避 
免 了 超过 6500 万 美元 的 经 济 损失 。 此 外 ,有 研究 人 员 表 示 , 当 时 从 那些 看 似 
简陋 的 模拟 实验 中 得 到 的 结果 远 比 现在 的 数字 模型 准确 。 

第 二 个 谈 到 的 模型 来 自 经 济 学 ,在 这 个 模型 里 ,流动 的 水 也 是 一 个 重 : 
组 成 部 分 。 

1949 年 ,当时 还 是 伦敦 经 济 学 院 一 名 学 生 的 新 西 兰 经 济 学 家 威廉 。 菲 
利 普 斯 (William Phillips) ,在 研究 英国 经 济 运 行 过 程 时 ,构建 了 一 个 长 、 宽 、 
高 分 别 约 为 1. 2 米 、1 米 、2 米 的 模型 ,这 个 模型 被 命名 为 MONIAC 


章 


(Monetary National Income Analogue Computer, 货币 国民 收入 模拟 计算 
机 )。 在 MONIAC 中 ,包括 一 些 透 明 的 管道 和 水 箱 。 水 箱 代表 英国 经 济 系 
统 的 不 同方 面 , 比 如 最 项 上 的 水 箱 代表 英国 的 总 财富 ,管道 中 流动 着 的 染 了 
色 的 水 代表 财富 或 金钱 在 系统 中 运行 流转 的 过 程 。 

MONIAC 模型 可 以 用 来 展示 凯恩斯 经 济 政策 带 来 的 影响 。 但 实际 上 ， 
虽然 MONIAC 看 起 来 很 高 大 上 ,但 它 的 准确 度 和 可 靠 性 还 比 不 上 密西西比 


DO Backchannel. Our Machines Nor Have Knowledge We'll Never Understand. https: 


//backchannel. com/our-machines-now-have-knowledge-well-never-understand-857a479dcc0e。 
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河 模型 。 这 里 的 原因 可 能 是 ,MONIAC 中 只 包含 了 影响 国家 经 济 状况 的 重 
要 变量 ,而 没有 包含 全 部 变量 。 但 在 密西西比 河 模型 中 ,也 有 很 多 人 类 无 法 
列 出 的 变量 的 影响 ,例如 河流 沿途 的 山脉 .植被 变化 ,或 是 月 球 引 力 的 影响 。 
但 为 什么 密西西比 河 模型 却 能 够 得 到 与 真实 情况 基本 吻合 的 结果 呢 ? 

对 比 密西西比 河 模型 和 MONIAC 模型 ,前 者 是 一 个 物理 模型 ,后 者 是 
一 个 人 工 模型 。 例 如 ,你 如 果 想 看 看 密西西比 河沿 岸 的 山体 塌方 时 ,垮塌 的 
山石 深入 河道 会 有 什么 情况 ,你 要 做 的 只 是 制造 一 些 相应 比例 的 岩石 模型 ， 
扔 到 密西西比 河 模型 中 ,就 可 以 直观 看 到 发 生 的 结果 。 你 完全 不 需要 花费 大 
的 时 间 和 精力 去 学 习 和 了 解 流体 力学 的 相关 知识 。 也 就 是 说 , 当 模型 的 比 
例 对 结果 没有 影响 时 ,物理 模型 就 会 给 你 想 知 道 的 答案 。 对 此 ,高 级 水 利 专 
家 斯 坦 福 ' 吉布森 (Stanford Gibson) 的 说 法 可 能 更 通俗 易 懂 :“ 物 理 模 型 会 
自行 模拟 所 有 的 过 程 。” 

在 MONIAC 中 ,利用 有 颜色 的 水 来 模拟 货币 在 经 济 系统 中 的 流转 运行 
过 程 ,从 而 验证 各 种 经 济 理 论 。 与 上 面 讲 述 的 密西西比 河 这 样 的 物理 模型 不 
同 的 是 ,MONIAC 的 构建 是 基于 人 们 事先 进行 的 逻辑 推理 而 形成 的 数学 模 
型 。 这 些 模型 中 其 实 隐 含 了 诸多 限制 ,在 MONIAC 中 水 箱 的 大 小 .水量 的 
多 少 水管 的 粗细 ,流向 控制 则 体现 了 这 些 限制 的 存在 。 这 些 限制 并 非 自 然 
形成 , 带 有 很 深 的 人 为 印记 。 密 西西 比 河 模型 中 看 似 没有 多 少 假定 的 限制 ， 
其 实 不 然 。 密 西西 比 河 模型 假定 了 比例 无 关 , 在 真实 环境 中 会 发 生 的 事情 在 
1 : 10 000 的 模型 中 也 会 发 生 。 模 型 还 假定 了 河流 沿岸 山脉 的 高 度 、 沿 岸 田 
地 里 是 否 有 农作物 等 因素 对 实验 的 结果 没有 影响 。 

两 种 模型 中 都 有 假定 这 种 限制 存在 , 那 为 什么 密西西比 河 模型 能 取得 很 
好 的 结果 ,而 MONIAC 得 到 的 结论 有 时 却 离 事实 相差 很 远 呢 ?” 其 实 ,在 密 
西西 比 河 模型 管用 的 情况 下 ,人 们 也 不 明白 它 为 什么 行 得 通 。 密 西西 比 河 模 
型 的 构建 没有 基于 任何 数学 模型 , 它 的 形成 基于 客观 存在 ,仅仅 是 在 比例 大 
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小 或 某 些 不 重要 的 因素 上 有 所 不 同 。 或 许 , 它 能 够 有 很 好 的 效果 就 在 于 人 们 
没有 过 多 地 干预 , 它 不 需要 人 们 理解 它 为 什么 管用 ,让 它 模拟 客观 存在 并 自 
行 演进 就 好 ,无 须 再 施加 入 们 的 逻辑 推理 所 带 来 的 限制 。 有 可 能 ,人 们 根据 
自己 的 理解 强加 给 模型 的 限制 , 正 是 使 模型 得 出 不 准确 结果 的 原因 。 

一 直 以 来 ,人 们 都 是 先 手工 设计 模型 ,然后 再 将 模型 通过 计算 机 来 处 理 
和 验证 。 这 种 方法 的 问题 在 于 ,要 想得到 更 好 的 结果 ,人 们 就 需要 不 断 升 级 
模型 ,以 使 它 变 得 更 加 具体 准确。 但 在 这 个 过 程 中 ,人 们 无 法 保证 自己 的 理 
解 的 正确 性 ,也 无 法 保证 不 会 引入 更 多 干扰 ,这 些 都 与 人 们 的 知识 和 理解 紧 
密 相 关 。 得 益 于 机 器 学 习 的 出 现 ,人 们 可 以 有 另外 的 选择 。 人 们 可 以 尝试 放 
手 , 让 机 器 以 算法 思维 来 理解 人 类 的 世界 ,自行 进化 。 

目前 看 来 ,Google 公司 的 AlphaGo 项 目 是 让 机 器 按照 自己 的 “意愿 ” 进 
行 学 习 和 理解 人 类 世界 的 一 次 有 趣 尝试 。AlphaGo 在 战胜 了 围棋 大 师 李 世 
石 后 ,在 非 正式 情况 下 , 它 的 升级 版 本 Master 又 取得 连 胜 60 盘 的 梦幻 成 绩 。 
从 理论 上 讲 ,围棋 中 可 能 的 变化 数 达 到 了 10” 之 多 。AlphaGo 进行 决策 的 
大 脑 是 由 多 层 神经 网 络 构成 , 它 使 用 了 发 生 在 人 类 棋 手 之 间 的 16 万 盘 对 局 
约 3000 万 步 走 法 对 自己 进行 训练 ,来 理解 怎样 才能 在 于 棋 这 个 游戏 中 取得 
最 高 的 胜率 。 支 撑 这 一 切 的 硬件 也 仅仅 是 48 个 CPU( 处 理 器 ), 再 加 上 额外 
的 8 个 GPU( 图 形 处 理 器 ) 。 

尽管 AlphaGo 已 经 是 无 可 非议 的 世界 级 棋 手 ,但 它 没有 办 法 讲 出 能 够 
让 人 类 棋 手 学 习 和 理解 的 道理 ,因为 决定 其 走 法 的 核心 是 “概率 ”, 这 跟 人 类 
对 围棋 的 理解 完全 不 同 。AlphaGo 的 决策 是 依靠 多 层 神经 网 络 中 的 数 十 亿 
个 连接 , 它 自 行 创 造 了 一 个 极其 复杂 的 模型 。 这 个 模型 中 产生 的 巨 量 应 变 走 
法 的 目的 仅仅 是 为 了 在 围棋 中 战胜 人 类 ,并 无 其 他 。 如 果 你 非得 用 人 类 “ 渺 
小 ”的 大 脑 去 试图 理解 AlphaGo 的 每 一 步 走 法 ,在 令 人 头 昏 脑 涨 的 解释 里 一 
定 会 无 数 次 出 现 “ 加 权 连 接 网 络 ”, 这 些 连 接 负 责 将 结果 传递 到 下 一 层 神 经 网 
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络 。 人 类 的 大 脑 根本 无 法 记 住所 有 的 变量 和 权重 ,以 至 于 根本 无 法 进行 基于 
这 些 变量 和 权重 的 计算 。 就 算 能 够 计算 ,人 类 也 不 知道 如 何 根据 计算 结果 去 
下 围棋 ,这 些 结果 与 人 类 的 认 知 完全 不 同 , 这 是 算法 的 认 知 逻 辑 ,是 内 化 的 人 
类 下 棋 时 神经 状态 的 运行 原理 ,并 不 能 帮助 你 理解 它 的 走 法 ,只 有 机 器 ( 算 
法 ) 才 明白 这 究竟 是 什么 。 

人 类 无 法 理解 机 器 (算法 ) 带 来 的 知识 ,也 有 两 者 认 知 模式 不 同 的 原因 。 
举例 来 说 ,人 类 识别 数字 “0”, 是 根据 在 学 习 过 程 中 所 获得 的 知识 或 规则 来 判 
断 , 例 如 ,数字 0 特别 类 似 圆 圈 , 也 特别 像 字 母 o。 但 机 器 则 不 然 , 给 机 器 提 
供 成 干 上 万 个 书写 的 数字 0 的 图 片 , 它 会 将 这 些 图 片 转换 为 二 进 制 存 储 的 矩 
阵 并 寻找 这 些 矩 阵 的 相似 度 ,进而 根据 这 些 学 到 的 知识 来 判断 新 的 图 片 中 是 
否 有 数字 0, 同 时 还 要 根据 上 下 文 来 排除 字母 0, 说 实话 ,识别 0 和 o 对 于 人 
类 来 说 都 有 相当 的 难度 ,对 于 这 一 点 ,在 网 上 填 过 随机 图 片 验证 码 的 人 一 定 
深 有 体会 。 

在 算法 的 作用 下 ,机 器 的 智能 化 程度 越 来 越 高 ,在 发 现 模式 .做 出 结论 方 
面 的 能 力 已 经 超过 了 人 类 。 并 且 , 随 着 硬件 的 高 速 发 展 ,计算 机 在 建立 模型 
时 可 以 做 得 尽 可 能 地 大 ,只 要 算法 和 硬件 能 够 支持 。 比 如 , 人工 神 经 网 络 层 
数 越 多 越 准确 ,当然 复杂 度 也 更 高 ,在 当前 的 条 件 下 ,深度 达 几 百 层 的 神经 网 
络 ,已 经 不 是 问题 。 模 型 能 做 得 足够 大 ,其 中 能 够 容纳 的 变量 就 更 多 ,就 可 以 
考虑 更 多 的 影响 因素 ,而 不 用 通过 简化 或 分 解 以 迎合 相对 简单 的 模型 。 但 
是 ,这 同时 也 意味 着 ,我 们 想 要 了 解 的 客体 或 现象 ,必须 依靠 机 器 得 出 的 结 
果 。 然 而 ,对 于 机 器 怎么 建 模 、. 如 何 求解 的 过 程 , 则 是 人 们 无 从 得 知 ,也 无 法 
理解 和 解释 的 。 对 于 此 ,机 器 学 习 专家 亚当 ' 盖 特 吉 (Adam Geitgey) 有 一 段 
形象 的 描述 : “通过 泛 型 算法 能 够 告诉 你 一 组 数据 的 有 趣 之 处 ,并 且 你 无 须 
针对 问题 编写 任何 代码 。 你 只 需要 给 泛 型 算法 提供 输入 数据 ,然后 它 就 会 根 
据 那 些 数据 建立 自己 的 逻辑 。” 
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在 不 少 人 看 来 ,这 样 的 模式 ,有 可 能 颠覆 人 们 传统 的 认 知 观念 。 这 种 使 
用 异类 智能 的 方式 ,引发 了 人 们 对 一 直 以 来 的 西方 传统 中 植 入 的 假设 思维 产 
生 了 疑问 。 正 如 美国 著名 评论 家 大 卫 : 温 伯 格 (David Weinberger) 在 媒体 
网 站 Backchannel 的 文章 里 所 说 :“ 以 前 ,人 们 认为 ,知识 的 存在 是 为 了 简化 
这 个 复杂 的 世界 。 但 当前 的 情况 ,似乎 在 说 人 们 搞 错 了 ,认识 我 们 身 处 的 世 
界 ,可 能 反而 需要 放弃 去 理解 它 。” 


人 类 还 能 做 点 什么 


知识 是 确证 的 真 信念 。 


自从 人 们 开始 在 绳子 上 打 结 ,或 者 在 木 棍 上 刻 凹 痕 来 帮助 计数 以 来 ,人 
们 一 直 都 是 通过 这 个 世界 中 客观 存在 的 事物 来 辅助 自己 了 解 和 认识 世界 。 
人 们 很 清楚 每 个 强 结 或 是 痕 所 代表 的 含义 ,或 者 再 复杂 一 点 ,人 们 知道 修建 
密西西比 河 模型 的 目的 是 为 了 应 对 洪水 的 发 生 。 人 类 一 直 以 来 都 有 一 种 信 
念 ,认为 这 些 可 以 带 来 知识 的 模型 ,本 身 能 够 准确 地 反映 世界 的 运转 方式 。 
但 现在 正在 发 生 的 事情 , 却 正在 使 人 们 的 这 个 信念 变 得 摇摇欲坠 。 人 们 越 来 
越 多 地 依靠 那些 并 不 符合 人 类 推理 逻辑 的 东西 ,虽然 人 们 还 没有 办 法 去 理解 
那些 冷冰冰 的 没有 感知 的 小 伙伴 们 推导 出 答案 的 方式 和 过 程 。 如 果 说 知识 
的 概念 确实 是 古 希 腊 哲 学 家 柏拉图 所 定义 的 那样 ,那么 人 们 应 该 如 何 去 理 解 
这 种 新 得 到 的 知识 ? 要 知道 ,现在 这 种 新 型 知识 不 仅 难以 解释 确证 ,更 是 无 
从 解释 确证 。 这 开始 令 人 类 感到 不 安 , 人 类 总 是 对 未 知 的 事物 心怀 恐惧 ,就 
像 在 古 时 ,人 们 不 了 解 月 食 现象 ,恐惧 之 下 ,只 好 用 “天 狗 吃 月 ”这 类 带 有 神学 
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色彩 的 说 法 来 解释 一 样 。 

计算 机 从 一 出 现 , 就 在 随 着 硬件 的 发 展 ,不 断 扩 展 其 能 够 处 理 的 信息 量 。 
我 们 可 以 类 比 前 面 定 义 的 信息 “人 比 ”, 给 出 “机 器 比 ” 的 概念 , 即 计算 机 能 接 
收 和 处 理 的 最 大 信息 量 。 通 常 来 说 ,机 器 比 大 于 人 比 。 当 人 类 世界 进入 赛 博 
时 代 后 ,信息 开始 爆炸 性 增长 。 对 人 类 来 说 ,获取 大 量 知 识 是 困难 的 ,因为 这 
需要 汇集 一 批 人 比 的 信息 ,而 人 与 人 之 间 建 立 联系 的 难度 限制 了 这 一 汇集 过 
程 。 与 人 类 不 同 , 赛 博 的 出 现 使 机 器 之 间 建 立 连接 变 得 毫 无 问题 ,同时 ,机 器 
之 间 的 沟通 远 比 人 类 更 加 高 效 和 简单 , 当 机 器 不 断 变革 ,机 器 比 也 被 无 限 放 
大 。 当 下 ,计算 机 能 够 容纳 网 络 中 的 全 部 信息 。 这 些 信息 不 仅 包括 存储 在 数 
据 库 中 的 历史 内 容 , 还 包括 来 自 人 类 行为 和 遍布 全 球 的 各 类 传感器 产生 的 实 
时 信息 。 现 在 的 信息 更 像 是 不 断 汇聚 融合 的 溪流 ,而 不 是 储藏 在 数据 仓库 里 
的 资源 。 

从 信息 的 产生 量 和 存储 量 , 以 及 赛 博 世界 的 连接 关系 拓扑 ,可 以 让 我 们 
认识 到 身 处 的 世界 是 多 么 庞杂 ,多 么 不 确定 。 几 干 年 来 ,大 约 从 人 们 开始 理 
性 思考 开始 ,人 们 就 毫 不 动摇 地 认为 简单 模型 会 反映 宇宙 的 简单 性 。 现 在 ， 
正 是 人 类 自己 创造 的 机 器 给 了 我 们 当头 一 棒 , 它 告诉 人 们 ,世界 在 它 的 眼 里 
是 何等 的 错综复杂 ,以 人 类 大 脑 的 认 知 无 法 理解 ,需要 借助 由 人 类 和 计算 机 
组 成 的 网 络 才能 认识 到 : 这 个 世界 完 完全 全 是 混沌 的 和 不 确定 的 。 

面 对 这 个 混沌 的 世界 , 当 人 们 开始 依赖 于 不 可 理解 的 模型 给 出 的 知识 ， 
这 里 会 出 现 一 个 问题 , 谁 来 对 这 些 新 型 知识 确证 ?” 几 干 年 前 ,柏拉图 就 告诉 
我 们 ,没有 确证 的 信念 不 成 为 知识 。 然 而 ,机 器 可 以 确证 的 ,往往 是 人 类 无 法 
理解 的 。 一 个 可 能 的 应 对 是 人 们 需要 放弃 某 些 知识 。 事 实 上 ,在 现实 中 ,我 
们 已 经 开始 这 么 做 了 。 例 如 ,法 院 已 经 规定 ,未 经 合法 方式 (授权 ) 所 取得 的 
信息 不 能 成 为 证 据 , 因 为 如 果 允 许 这 类 证 据 出 现 ,显然 会 给 公诉 方 带 来 收集 
这 些 证 据 的 动机 。 另 外 ,机 器 学 习 算法 已 经 应 用 于 社会 信用 评级 领域 。 在 我 


337 


算法 统治 世界 一 智能 经 济 的 隐形 秩序 


国 ,人 们 熟悉 的 芝麻 信用 分 就 是 一 个 典型 的 例子 。 同 时 ,人 们 各 自 的 信用 分 
又 各 不 相同 ,这 是 因为 算法 采用 的 评判 标准 包括 身份 特质 .居住 情况 .履约 能 
力 、 消 费 习 惯 、 人 肪 关系 等 诸多 因素 。 不 过 ,在 不 同 的 国家 或 地 区 ,一 些 特殊 
的 评价 因素 可 能 不 适用 。 例 如 ,在 美国 ,评级 算法 可 能 会 发 现 , 不 同宗 教 信仰 
的 人 ,信用 风险 会 不 一 样 。 尽 管 这 可 能 是 事实 ,但 美国 的 法 律 规 定 了 这 些 机 
器 得 出 的 知识 也 不 能 用 于 对 用 户 进行 信用 评价 ,信用 评分 公司 也 会 被 禁止 使 
用 与 信仰 属性 有 关 的 数据 。 

另外 一 方面 ,机 器 展现 出 来 的 能 力 的 确 非常 强大 ,但 它 给 出 的 结果 一 定 
是 正确 的 吗 ? 机 器 是 从 人 类 历史 数据 中 进行 学 习 , 由 于 人 性 中 确实 多 少 带 有 
一 些 灰 暗 属 性 ,这 可 能 会 给 数据 中 带 入 负面 的 干扰 ,从 而 给 机 器 形成 的 结论 
带 来 影响 。 比 如 ,在 美国 用 来 评估 申请 保释 的 罪犯 带 有 潜在 风险 的 系统 ,在 
训练 过 程 完成 后 ,开始 进行 实际 评估 操作 时 ,人 们 发 现 它 往往 会 为 白人 罪犯 
网 开 一 面 , 但 对 那些 犯罪 记录 较 少 非 毅 或 亚 裔 美国 人 则 异常 严厉 。 不 难 解 
释 ,这 是 机 器 学 习 有 了 人 类 历史 数据 中 的 种 族 偏见 ,虽然 美国 一 直 自 调 人 权 

2013 年 美国 波士顿 马拉松 爆炸 案 后 的 7 月 31 号 ,家 住 纽 约 纳 苏 县 的 女 
记者 卡 塔 拉 诺 在 家 突然 遭 到 FBI* 反 恐 联合 工作 组 ”6 名 特工 的 搜查 。 据 卡 塔 
拉 诺 称 ,FBI 的 特工 大 约 花 费 45 分 钟 时 间 搜 查 她 家 ,盘问 她 丈夫 的 网 上 搜索 
和 他 到 海外 的 公务 旅行 。 造 成 这 次 搜查 的 原因 居然 是 因为 卡 塔 拉 诺 在 亚 马 
逊 网 站 上 搜索 过 高 压 锅 , 高 压 锅 正 好 是 波士顿 马拉松 爆炸 案 中 嫌犯 使 用 的 工 
具 , 不 知道 什么 原因 触发 了 监控 软件 发 出 了 疑似 恐怖 活动 的 警告 。 

早年 Google 的 算法 也 出 现 过 乌 龙 事 件 。2009 年 ,Google 的 工程 师 在 世 
界 顶级 学 术 期 刊 Nature 上 发 表 了 一 篇 关于 流感 疫情 预测 的 论文 ,同时 聪明 
的 工程 师 们 还 上 线 了 流感 预测 系统 GFT(Google Flu Trends)。 当 时 ,美国 
国家 疾 控 中 心 的 预警 通告 要 比 实际 情况 滞后 两 周 左右 ,而 GFT 得 出 的 预警 
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滞后 时 间 仅 为 1 天 ,有 时 只 是 几 个 小 时 , 亮 出 的 成 绩 单 非常 惊艳 ,在 当时 引起 
巨大 反响 。 但 好 景 不 长 ,到 了 2014 年 ,有 学 者 在 另 一 本 世界 顶级 学 术 期 刊 
Science 上 发 文公 布 了 GFT 的 预测 情况 。 从 2011 年 8 月 起 的 108 周 时 间 
里 ,有 100 周 GFT 的 预测 均 大 幅 偏 高 ,其 中 2012 年 12 月 的 一 次 预警 比 实际 
情况 高 出 近乎 一 倍 。 为 什么 会 出 现 这 种 情况 ? 原来 GFT 的 预测 原理 是 基于 
一 个 简单 的 情形 : 如 果 在 某 一 区 域 的 某 一 时 段 ,出 现 大 量 关 于 流感 的 搜索 ， 
那么 该 区 域 可 能 出 现 了 流感 疫情 。 其 实 ,Google 的 工程 师 们 并 不 知道 关键 
词 搜索 与 流感 爆发 之 间 是 否 存在 关联 。 让 工程 师 们 没 想到 的 是 ,GFT 的 成 
功 引 发 了 人 们 的 好 奇 心 ,人 们 都 想来 看 看 这 个 神奇 的 系统 ,结果 造成 了 预警 
信息 失效 。 

从 这 些 例子 中 可 以 看 到 ,人 类 或 许 能 够 在 事后 及 时 修正 偏见 ,但 机 器 在 
学 习 过 程 中 可 能 会 重新 建立 起 我 们 当前 已 经 修正 的 隐 含 在 数据 中 的 偏见 。 
因此 ,对 人 类 来 说 ,也 许 我 们 需要 做 两 件 事 : 一 方面 ,人 们 应 当 禁 止 一 些 确证 
类 型 ,以 避免 造成 不 良 的 社会 影响 。 另 一 方面 ,人 们 应 该 着 手 制定 一 些 规范 
和 监督 手段 ,类 似 于 阿 西 莫 夫 的 机 器 人 三 定律 那样 ,确保 有 效 减 小 和 避免 错 
误 的 发 生 。 


HH 


拥抱 “异类 ”智能 


我 看 到 一 个 以 前 没有 见 过 的 轮子 不 停 地 旋转 ,时 而 上 升 , 时 而 下 降 …… 
命运 之 轮 将 我 们 多 次 推 入 深渊 ,但 是 它 又 多 次 将 我 们 送 上 若 峰 ,如 此 循环 往 
复 。 我 们 应 该 了 解 命运 的 转 轮 。 


一 一 万 那 。 怀 特 (Vanna White) ,演员 
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人 类 创造 的 机 器 在 算法 和 赛 博 的 作用 下 ,其 能 力 正 日 益 变 得 强大 。 它 们 
完全 不 需要 人 们 事先 将 需要 的 信息 进行 缩减 ,机 器 比 已 经 无 限 扩大 。 正 是 由 
于 它们 拥有 了 这 种 新 能 力 , 人 们 正 逐 渐 习 惯 于 交 给 它们 所 有 可 能 需要 的 信 
息 , 然 后 再 问 自己 想 知道 的 问题 。 但 在 背后 ,人 们 无 法 理解 它们 的 思维 方式 ， 
就 像 外 行 可 能 无 法 完全 理解 TCP/IP 协议 的 细节 。 而 且 , 基 于 计算 机 的 确 
证 ,在 本 质 上 完全 不 同 于 人 类 的 确证 方式 。 机 器 的 智能 是 一 种 “异类 ”智能 ， 
不 过 ,异类 并 不 意味 机 器 的 认 知 是 错误 ,而 仅仅 是 指 确证 方式 与 人 类 不 同 。 
要 说 到 理解 认 知客 观 世 界 ,真相 可 能 会 令 人 类 感到 有 点 泪 形 , 那 就 是 机 器 比 
我 们 人 类 在 任何 时 候 都 要 更 加 接近 世界 的 本 质 。 

在 获取 知识 这 件 事情 上 ,一 直 以 来 人 类 都 是 利用 工具 来 完成 的 。 几 千年 
前 的 放牧 入, 由 于 不 懂 数 学 ,他 需要 准备 一 些小 圆 石 子 , 以 确保 放牧 归来 时 牲 
畜 的 数量 与 出 发 时 一 致 , 至 少 不 会 变 少 ;现在 的 学 者 在 思考 问题 时 ,很 可 能 还 
需要 稿 纸 或 白板 来 做 推导 的 工作 ;建筑 师 需要 够 大 的 纸张 \ 直 尺 、 铅 笔 甚至 三 
维 模型 来 思考 建筑 的 构造 。 现 在 ,这 些 领域 的 从 业 人 员 都 已 经 转 为 使 用 电脑 
了 ,前 面谈 到 的 放牧 人 甚至 可 以 通过 给 牛 羊 身 上 加 装 微型 传感器 ,然后 通过 
最 新 的 手机 App 来 管理 自己 的 牧 群 。 然 而 ,情况 还 是 没 变 : 我 们 仍然 在 利 上 
工具 来 理解 这 个 世界 。 只 不 过 ,上 述 这 些 利用 工具 的 方式 ,是 人 们 能 够 理解 
的 方式 。 

而 人 工 智能 和 机 器 学 习 的 发 展 , 则 进一步 凸显 了 人 类 的 理解 力 相 对 于 其 
给 自己 设 定 的 任务 的 不 足 。 人 类 仍然 在 利用 工具 理解 世界 ,只 是 现在 的 工具 
换 成 了 计算 机 。 当 机 器 使 用 神经 网 络 等 人 类 所 无 法 理解 的 确证 方式 给 出 得 
到 的 知识 时 ,人 类 往往 手足 无 措 。 人 们 可 以 通过 强调 AlphaGo 不 断 战胜 人 
类 棋 手 ,以 及 算法 驾驶 的 汽车 确实 更 少 发 生 交通 事故 等 事例 ,来 证 明 机 器 通 
过 学 习 得 出 的 结果 很 有 可 能 是 知识 ,但 人 们 还 是 不 能 理解 AlphaGo 为 什么 
会 下 这 一 步 ,而 不 是 那 一 步 ,也 不 能 够 理解 明明 应 该 往 左 转 ,但 机 器 却 控制 汽 
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车 往 右 转 。 这 里 面 涉及 各 类 信息 输入 、 机 器 的 决策 过 程 ,正如 在 前 面 反 复 讲 
到 的 ,这 些 东西 即便 是 最 聪明 的 人 脑 也 无 法 理解 。 

在 Our Machines Now Have Knowledge We Never Understand 中 提 
到 ,人 类 其 实 一 直 存 在 一 个 幻觉 : 只 要 计算 机 还 能 够 通过 模型 把 人 们 的 想法 
具体 展现 出 来 ,人 们 就 还 是 认为 世界 在 按照 其 拥有 的 知识 (模型 ) 所 理解 的 方 
式 运 转 。 然 而 ,一 旦 计算 机 开始 按 自己 的 方式 创建 模型 ,并 且 这 些 模型 超出 
人 们 的 理解 范畴 ,人 们 就 失去 了 那 种 令 人 心安 的 假设 。 我 们 自己 创造 的 机 器 
让 人 类 知识 论 的 局 限 性 变 得 显而易见 。 当 我 们 不 能 理解 计算 机 创造 的 模型 
时 ,我们 还 能 心安 理 得 的 认为 计算 机 一 定 是 人 类 的 奴仆 吗 ? 

科技 在 人 类 发 展 历史 的 长 河中 总 是 扮演 着 最 活跃 最 革命 的 角色 , 它 的 发 
展 是 不 可 阻挡 的 。 而 面 对 发 展 的 未 知 , 我 们 难免 丽 惧 。 机 器 能 做 到 什么 程 
度 ? 智能 的 爆炸 是 什么 样 的 ? 机 器 学 习 革命 会 以 什么 方式 呈现 ? 算法 如 何 
运行 ? 我 们 需要 进行 怎样 的 认 知 ? 也许 只 有 当 我 们 能 够 真实 地 去 面 对 这 些 
问题 , 划 定 它 的 边界 和 围栏 ,而 不 是 回避 它 、 否 定 它 和 阻止 它 的 时 候 , 我 们 才 
能 真正 地 迎 来 这 个 可 以 被 计算 的 世界 ,一 个 由 算法 定义 的 世界 。 


国 藻 牧 曾 《对 狂 丝 盎 阴 其 这 碍 蝶 一 一 关内 民 吃 妥 莫 》 


